Τα προηγμένα μοντέλα τεχνητής νοημοσύνης καταρρέουν μπροστά σε σύνθετα προβλήματα, δείχνει έρευνα

Τα προηγμένα μοντέλα τεχνητής νοημοσύνης καταρρέουν μπροστά σε σύνθετα προβλήματα, δείχνει έρευνα Facebook Twitter
Η προηγμένη τεχνητή νοημοσύνη δεν κατόρθωσε να λύσει περίπλκα προβλήματα / Φωτογραφία: Freepik.com
0

Μια νέα μελέτη της Apple αποκαλύπτει σοβαρούς περιορισμούς στις δυνατότητες των πιο εξελιγμένων μοντέλων τεχνητής νοημοσύνης, αμφισβητώντας τις κυρίαρχες προσδοκίες της τεχνολογικής βιομηχανίας για την επίτευξη τεχνητής γενικής νοημοσύνης (AGI).

Σύμφωνα με την έρευνα που δημοσιεύτηκε το Σαββατοκύριακο, τα λεγόμενα μοντέλα μεγάλης συλλογιστικής (Large Reasoning Models – LRM), μια προηγμένη κατηγορία συστημάτων ΤΝ σχεδιασμένων για επίλυση σύνθετων προβλημάτων μέσω αναλυτικών βημάτων σκέψης, υπέστησαν πλήρη κατάρρευση ακρίβειας όταν αντιμετώπισαν προβλήματα αυξημένης πολυπλοκότητας.

Αντίθετα, σε εργασίες χαμηλής δυσκολίας, τα συμβατικά μοντέλα ΤΝ είχαν καλύτερες επιδόσεις. Όμως και οι δύο τύποι μοντέλων εμφάνισαν σημαντικά ελλείμματα σε πιο απαιτητικά σενάρια, με τα LRM να παρουσιάζουν ανησυχητικά σημάδια «παραίτησης» από την προσπάθεια συλλογισμού, καθώς πλησίαζαν το όριο αποτυχίας.

Τεχνητή νοημοσύνη: «Καταστροφικά» τα ευρήματα για την πορεία προς την AGI

Ο Gary Marcus, διακεκριμένος ακαδημαϊκός και ένθερμος επικριτής της υπερεκτίμησης των δυνατοτήτων των LLM (μεγάλα γλωσσικά μοντέλα), χαρακτήρισε τη μελέτη της Apple ως «αρκετά καταστροφική». Όπως σχολίασε:

«Όποιος πιστεύει ότι τα LLM αποτελούν άμεση οδό προς την AGI που θα μεταμορφώσει ριζικά την κοινωνία προς το καλύτερο, κάνει λάθος».

Η μελέτη ανέλυσε πώς τα μοντέλα επιχειρούν την επίλυση προβλημάτων μέσω δομημένης σκέψης, διαπιστώνοντας ότι όσο αυξάνεται η δυσκολία, τόσο μειώνεται η ικανότητά τους να εφαρμόζουν συνεπή λογικά βήματα. Μάλιστα, ακόμα και όταν τους παρέχεται ορθός αλγόριθμος για την επίλυση ενός προβλήματος, αδυνατούν να τον ακολουθήσουν αποτελεσματικά.

Η ερευνητική ομάδα σημειώνει: «Μόλις τα μοντέλα πλησιάσουν ένα κρίσιμο όριο – το οποίο ταυτίζεται με την κατάρρευση της ακρίβειάς τους – αρχίζουν να μειώνουν την προσπάθεια συλλογισμού τους, παρότι τα προβλήματα γίνονται δυσκολότερα».

Αυτό το εύρημα ερμηνεύεται ως ένδειξη θεμελιώδους περιορισμού κλιμάκωσης των γνωστικών δυνατοτήτων των σύγχρονων LRM.

Δοκιμές με γρίφους και γνωστά μοντέλα Τεχνητής Νοημοσύνης

Η μελέτη περιλάμβανε δοκιμές επίλυσης κλασικών γρίφων, όπως ο Πύργος του Ανόι και τα παζλ «διάσχισης ποταμού». Οι ερευνητές αναγνώρισαν ότι η έμφαση στα παζλ αποτελεί έναν περιορισμό της μελέτης, αλλά τόνισαν ότι πρόκειται για αναγνωρισμένα τεστ γνωστικής ικανότητας.

Μεταξύ των μοντέλων που αξιολογήθηκαν ήταν:

  • GPT o3 της OpenAI
  • Gemini Thinking της Google
  • Claude 3.7 Sonnet-Thinking της Anthropic
  • DeepSeek-R1 της DeepSeek

Οι εταιρείες Anthropic, Google και DeepSeek κλήθηκαν να σχολιάσουν τα ευρήματα, ενώ η OpenAI αρνήθηκε να σχολιάσει.

Ο Andrew Rogoyski, του Ινστιτούτου για την Ανθρωποκεντρική Τεχνητή Νοημοσύνη στο Πανεπιστήμιο του Surrey, σημείωσε ότι η μελέτη της Apple υπογραμμίζει τις δομικές αδυναμίες της παρούσας κατεύθυνσης στην ανάπτυξη ΤΝ: «Το γεγονός ότι τα μοντέλα μεγάλης συλλογιστικής χάνουν τη “συνοχή” τους στα πιο σύνθετα προβλήματα, παρότι αποδίδουν καλά στα απλούστερα, υποδηλώνει πως βρισκόμαστε πιθανόν μπροστά σε ένα τεχνολογικό αδιέξοδο».

Η μελέτη καταλήγει στο συμπέρασμα ότι η σημερινή προσέγγιση ανάπτυξης τεχνητής νοημοσύνης ίσως να έχει φτάσει τα όριά της, τουλάχιστον όσον αφορά την ικανότητα γενικευμένης συλλογιστικής - δηλαδή τη δυνατότητα να εφαρμόζεται ένα μεμονωμένο συμπέρασμα σε ευρύτερα πεδία.

Όπως επισημαίνουν οι ερευνητές: «Τα ευρήματά μας αμφισβητούν βασικές παραδοχές για το μέλλον των LRM και υποδεικνύουν ότι οι παρούσες τεχνικές ίσως αντιμετωπίζουν θεμελιώδη εμπόδια στην προσπάθεια για αληθινή γενίκευση σκέψης».


Με πληροφορίες από Guardian

 
 
 
 
Τech & Science
0

ΔΕΙΤΕ ΑΚΟΜΑ

ΕΓΚΕΦΑΛΟΣ ΠΑΙΧΝΙΔΙ ΜΥΑΛΟ

Τech & Science / Παιχνίδια εγκεφάλου: Νέα μελέτη δείχνει πώς «ξυπνούν» τον νου και καθυστερούν τη γήρανση

Μια νέα μελέτη αποκαλύπτει ότι συγκεκριμένα brain games, όπως αυτά του BrainHQ, μπορούν να αυξήσουν τη δραστηριότητα της ακετυλοχολίνης στον εγκέφαλο, επιβραδύνοντας τη γνωστική εξασθένηση και ενισχύοντας τη μνήμη και την προσοχή
LIFO NEWSROOM
Νέα μελέτη: Η διακοπή του καπνίσματος μειώνει τον κίνδυνο άνοιας

Τech & Science / Νέα μελέτη: Η διακοπή του καπνίσματος μειώνει τον κίνδυνο άνοιας

Νέα διεθνής μελέτη δείχνει ότι όσοι σταματούν το κάπνισμα στη μέση ηλικία μειώνουν στο μισό τη φθορά του εγκεφάλου και μέσα σε 10 χρόνια έχουν ίδιες πιθανότητες για άνοια με όσους δεν κάπνισαν ποτέ
LIFO NEWSROOM
Ο ανθρώπινος εγκέφαλος μπορεί να διαχειριστεί μέχρι 150 φίλους

Τech & Science / Ο ανθρώπινος εγκέφαλος μπορεί να διαχειριστεί μέχρι 150 φίλους

Η θεωρία των 150 φίλων του Robin Dunbar δείχνει πώς ο ανθρώπινος εγκέφαλος περιορίζει τον αριθμό των σταθερών κοινωνικών σχέσεων, ενώ η προσωπική επαφή παραμένει απαραίτητη ακόμη και στην ψηφιακή εποχή
LIFO NEWSROOM
Τα μικροπλαστικά φτάνουν μέχρι τον εγκέφαλο - Ίσως συνδέονται με κατάθλιψη και καρδιοπάθειες

Τech & Science / Τα μικροπλαστικά φτάνουν μέχρι τον εγκέφαλο - Ίσως συνδέονται με κατάθλιψη και καρδιοπάθειες

Μικροπλαστικά βρέθηκαν στο αίμα, στον εγκέφαλο και στο έντερο των ανθρώπων - Νέες έρευνες συνδέουν τα πλαστικά σωματίδια με την κατάθλιψη, την άνοια και τον καρκίνο
LIFO NEWSROOM
Εγκεφαλική εξέταση προβλέπει τις σεξουαλικές παρενέργειες των αντικαταθλιπτικών

Τech & Science / Εγκεφαλική εξέταση προβλέπει τις σεξουαλικές παρενέργειες των αντικαταθλιπτικών

Νέα έρευνα αποκαλύπτει ότι μια απλή εγκεφαλική εξέταση θα μπορούσε να προβλέψει ποιοι ασθενείς θα εμφανίσουν σεξουαλικές παρενέργειες από αντικαταθλιπτικά φάρμακα, ανοίγοντας τον δρόμο για πιο εξατομικευμένη θεραπεία κατά της κατάθλιψης
LIFO NEWSROOM
Microsoft: τέλος στην υποστήριξη των Windows 10 από την Τρίτη - Τι πρέπει να κάνουν οι χρήστες

Τech & Science / Microsoft: Τέλος στην υποστήριξη των Windows 10 από την Τρίτη - Τι πρέπει να κάνουν οι χρήστες

Οι υπολογιστές που θα συνεχίσουν να λειτουργούν με Windows 10 δεν θα λαμβάνουν κρίσιμες ενημερώσεις, γεγονός που αυξάνει τον κίνδυνο παραβιάσεων και κακόβουλων επιθέσεων
LIFO NEWSROOM
Καρκίνος του μαστού: Αύξηση των περιστατικών καρκίνου σε νεότερες ηλικίες

Τech & Science / Καρκίνος του μαστού: Αύξηση των περιστατικών σε νεότερες ηλικίες

«Το φαινόμενο είναι ανησυχητικό, αφού συχνά οι νεότερες ηλικίες δεν περιλαμβάνοται στα προγράμματα προληπτικού ελέγχου, από την άλλη φαίνεται μία σημαντική μείωση της θνησιμότητας στις ασθενείς αυτών των ηλικιών», εξηγεί ο πρόεδρος της Ελληνικής Αντικαρκινικής Εταιρείας
LIFO NEWSROOM
Οι φόβοι της Silicon Valley: Γιατί οι δισεκατομμυριούχοι της τεχνολογίας χτίζουν καταφύγια

Τech & Science / Οι φόβοι της Silicon Valley: Γιατί οι δισεκατομμυριούχοι της τεχνολογίας χτίζουν καταφύγια

Από το υπόγειο συγκρότημα του Μαρκ Ζούκερμπεργκ στη Χαβάη μέχρι τις επενδύσεις της Silicon Valley στη Νέα Ζηλανδία, η νέα τεχνολογική ελίτ φαίνεται να προετοιμάζεται για το απίθανο
LIFO NEWSROOM
Οι περισσότεροι άνθρωποι δεν ξεχωρίζουν την ανθρώπινη φωνή από εκείνη που έχει δημιουργηθεί μέσω τεχνητής νοημοσύνης

Τech & Science / Οι περισσότεροι άνθρωποι δεν ξεχωρίζουν την ανθρώπινη φωνή από εκείνη που έχει δημιουργηθεί μέσω τεχνητής νοημοσύνης

Φαίνεται πως όσο η τεχνολογία εξελίσσεται με ταχύτατους ρυθμούς, γίνεται όλο και πιο δύσκολο να ξεχωρίσουμε τι είναι αληθινό και τι όχι
LIFO NEWSROOM