Τα προηγμένα μοντέλα τεχνητής νοημοσύνης καταρρέουν μπροστά σε σύνθετα προβλήματα, δείχνει έρευνα

Τα προηγμένα μοντέλα τεχνητής νοημοσύνης καταρρέουν μπροστά σε σύνθετα προβλήματα, δείχνει έρευνα Facebook Twitter
Η προηγμένη τεχνητή νοημοσύνη δεν κατόρθωσε να λύσει περίπλκα προβλήματα / Φωτογραφία: Freepik.com
0

Μια νέα μελέτη της Apple αποκαλύπτει σοβαρούς περιορισμούς στις δυνατότητες των πιο εξελιγμένων μοντέλων τεχνητής νοημοσύνης, αμφισβητώντας τις κυρίαρχες προσδοκίες της τεχνολογικής βιομηχανίας για την επίτευξη τεχνητής γενικής νοημοσύνης (AGI).

Σύμφωνα με την έρευνα που δημοσιεύτηκε το Σαββατοκύριακο, τα λεγόμενα μοντέλα μεγάλης συλλογιστικής (Large Reasoning Models – LRM), μια προηγμένη κατηγορία συστημάτων ΤΝ σχεδιασμένων για επίλυση σύνθετων προβλημάτων μέσω αναλυτικών βημάτων σκέψης, υπέστησαν πλήρη κατάρρευση ακρίβειας όταν αντιμετώπισαν προβλήματα αυξημένης πολυπλοκότητας.

Αντίθετα, σε εργασίες χαμηλής δυσκολίας, τα συμβατικά μοντέλα ΤΝ είχαν καλύτερες επιδόσεις. Όμως και οι δύο τύποι μοντέλων εμφάνισαν σημαντικά ελλείμματα σε πιο απαιτητικά σενάρια, με τα LRM να παρουσιάζουν ανησυχητικά σημάδια «παραίτησης» από την προσπάθεια συλλογισμού, καθώς πλησίαζαν το όριο αποτυχίας.

Τεχνητή νοημοσύνη: «Καταστροφικά» τα ευρήματα για την πορεία προς την AGI

Ο Gary Marcus, διακεκριμένος ακαδημαϊκός και ένθερμος επικριτής της υπερεκτίμησης των δυνατοτήτων των LLM (μεγάλα γλωσσικά μοντέλα), χαρακτήρισε τη μελέτη της Apple ως «αρκετά καταστροφική». Όπως σχολίασε:

«Όποιος πιστεύει ότι τα LLM αποτελούν άμεση οδό προς την AGI που θα μεταμορφώσει ριζικά την κοινωνία προς το καλύτερο, κάνει λάθος».

Η μελέτη ανέλυσε πώς τα μοντέλα επιχειρούν την επίλυση προβλημάτων μέσω δομημένης σκέψης, διαπιστώνοντας ότι όσο αυξάνεται η δυσκολία, τόσο μειώνεται η ικανότητά τους να εφαρμόζουν συνεπή λογικά βήματα. Μάλιστα, ακόμα και όταν τους παρέχεται ορθός αλγόριθμος για την επίλυση ενός προβλήματος, αδυνατούν να τον ακολουθήσουν αποτελεσματικά.

Η ερευνητική ομάδα σημειώνει: «Μόλις τα μοντέλα πλησιάσουν ένα κρίσιμο όριο – το οποίο ταυτίζεται με την κατάρρευση της ακρίβειάς τους – αρχίζουν να μειώνουν την προσπάθεια συλλογισμού τους, παρότι τα προβλήματα γίνονται δυσκολότερα».

Αυτό το εύρημα ερμηνεύεται ως ένδειξη θεμελιώδους περιορισμού κλιμάκωσης των γνωστικών δυνατοτήτων των σύγχρονων LRM.

Δοκιμές με γρίφους και γνωστά μοντέλα Τεχνητής Νοημοσύνης

Η μελέτη περιλάμβανε δοκιμές επίλυσης κλασικών γρίφων, όπως ο Πύργος του Ανόι και τα παζλ «διάσχισης ποταμού». Οι ερευνητές αναγνώρισαν ότι η έμφαση στα παζλ αποτελεί έναν περιορισμό της μελέτης, αλλά τόνισαν ότι πρόκειται για αναγνωρισμένα τεστ γνωστικής ικανότητας.

Μεταξύ των μοντέλων που αξιολογήθηκαν ήταν:

  • GPT o3 της OpenAI
  • Gemini Thinking της Google
  • Claude 3.7 Sonnet-Thinking της Anthropic
  • DeepSeek-R1 της DeepSeek

Οι εταιρείες Anthropic, Google και DeepSeek κλήθηκαν να σχολιάσουν τα ευρήματα, ενώ η OpenAI αρνήθηκε να σχολιάσει.

Ο Andrew Rogoyski, του Ινστιτούτου για την Ανθρωποκεντρική Τεχνητή Νοημοσύνη στο Πανεπιστήμιο του Surrey, σημείωσε ότι η μελέτη της Apple υπογραμμίζει τις δομικές αδυναμίες της παρούσας κατεύθυνσης στην ανάπτυξη ΤΝ: «Το γεγονός ότι τα μοντέλα μεγάλης συλλογιστικής χάνουν τη “συνοχή” τους στα πιο σύνθετα προβλήματα, παρότι αποδίδουν καλά στα απλούστερα, υποδηλώνει πως βρισκόμαστε πιθανόν μπροστά σε ένα τεχνολογικό αδιέξοδο».

Η μελέτη καταλήγει στο συμπέρασμα ότι η σημερινή προσέγγιση ανάπτυξης τεχνητής νοημοσύνης ίσως να έχει φτάσει τα όριά της, τουλάχιστον όσον αφορά την ικανότητα γενικευμένης συλλογιστικής - δηλαδή τη δυνατότητα να εφαρμόζεται ένα μεμονωμένο συμπέρασμα σε ευρύτερα πεδία.

Όπως επισημαίνουν οι ερευνητές: «Τα ευρήματά μας αμφισβητούν βασικές παραδοχές για το μέλλον των LRM και υποδεικνύουν ότι οι παρούσες τεχνικές ίσως αντιμετωπίζουν θεμελιώδη εμπόδια στην προσπάθεια για αληθινή γενίκευση σκέψης».


Με πληροφορίες από Guardian

 
 
 
 
Τech & Science
0

ΔΕΙΤΕ ΑΚΟΜΑ

Apple και Google προωθούν εφαρμογές AI που «γδύνουν» φωτογραφίες ανθρώπων, σύμφωνα με έκθεση

Τech & Science / Apple και Google προωθούν εφαρμογές AI που «γδύνουν» φωτογραφίες ανθρώπων, σύμφωνα με έκθεση

Νέα έκθεση αποκαλύπτει ότι η Apple και η Google συνεχίζουν να φιλοξενούν και να προωθούν εφαρμογές που μπορούν να «γδύνουν» ψηφιακά πραγματικά πρόσωπα, παρότι αυτό απαγορεύεται ρητά από τις πολιτικές τους
THE LIFO TEAM
Γερμανία: Διαδικτυακή μηχανή αναζήτησης βοηθά ανθρώπους να ανακαλύψουν αν οι πρόγονοί τους ήταν Ναζί

Τech & Science / Γερμανία: Νέα μηχανή αναζήτησης αποκαλύπτει αν οι πρόγονοι κάποιου ήταν Ναζί

Πολλοί χρήστες δήλωσαν ότι ανακάλυψαν άγνωστες πτυχές για τις οικογένειές τους, κάτι που άλλαξε την εικόνα που είχαν για το παρελθόν τους, ενώ για κάποιους αποτέλεσε σοκ να συνειδητοποιήσουν την εμπλοκή συγγενών τους
THE LIFO TEAM
ΚΑΡΚΙΝΟΣ ΑΝΟΣΟΘΕΡΑΠΕΙΑ

Τech & Science / «Σαν σενάριο επιστημονικής φαντασίας»: Πώς η νέα γενιά ανοσοθεραπείας μπορεί να νικήσει τον καρκίνο

Η νέα ανοσοθεραπεία φέρνει εντυπωσιακά αποτελέσματα κατά του καρκίνου, με την επιστημονική κοινότητα να μιλά ακόμη και για μια νέα εποχή στην ογκολογία
THE LIFO TEAM
SOCIAL MEDIA ΑΥΣΤΡΑΛΙΑ ΑΝΗΛΙΚΟΙ

Τech & Science / Απαγόρευση social media στην Αυστραλία: Τα δύο τρίτα των ανηλίκων εξακολουθούν να έχουν πρόσβαση

Παρά την αυστηρή απαγόρευση που εφαρμόστηκε πριν από τέσσερις μήνες στη χώρα, νέα έρευνα δείχνει ότι η πλειονότητα των ανήλικων εξακολουθεί να έχει πρόσβαση στα social media
THE LIFO TEAM
Είναι το Mythos της Anthropic τόσο έξυπνο και δυνατό που καταντά επικίνδυνο;

Τech & Science / Είναι το Mythos της Anthropic τόσο έξυπνο και δυνατό που καταντά επικίνδυνο;

To εργαστήριο της Anthropic δηλώνει ιδιαίτερα θορυβημένo από την ικανότητα του συστήματος να εντοπίζει τρωτά σημεία λογισμικού και είτε να τα επιδιορθώνει (λειτουργώντας αμυντικά) είτε να τα εκμεταλλεύεται (λειτουργώντας ως χάκερ)
THE LIFO TEAM
ΠΡΟΩΡΟΣ ΤΟΚΕΤΟΣ ΧΗΜΙΚΕΣ ΟΥΣΙΕΣ ΠΛΑΣΤΙΚΑ

Τech & Science / Πρόωρος τοκετός: Τι είναι ο φθαλικός εστέρας και γιατί είναι επικίνδυνος

Νέα μελέτη διαπίστωσε ότι μια χημική ουσία που υπάρχει παντού γύρω μας θα μπορούσε να έχει συμβάλει σε 2 εκατομμύρια πρόωρους τοκετούς. Ωστόσο, δεν επηρεάζονται όλα τα μέρη του κόσμου στον ίδιο βαθμό.
THE LIFO TEAM