Τα προηγμένα μοντέλα τεχνητής νοημοσύνης καταρρέουν μπροστά σε σύνθετα προβλήματα, δείχνει έρευνα

Τα προηγμένα μοντέλα τεχνητής νοημοσύνης καταρρέουν μπροστά σε σύνθετα προβλήματα, δείχνει έρευνα Facebook Twitter
Η προηγμένη τεχνητή νοημοσύνη δεν κατόρθωσε να λύσει περίπλκα προβλήματα / Φωτογραφία: Freepik.com
0

Μια νέα μελέτη της Apple αποκαλύπτει σοβαρούς περιορισμούς στις δυνατότητες των πιο εξελιγμένων μοντέλων τεχνητής νοημοσύνης, αμφισβητώντας τις κυρίαρχες προσδοκίες της τεχνολογικής βιομηχανίας για την επίτευξη τεχνητής γενικής νοημοσύνης (AGI).

Σύμφωνα με την έρευνα που δημοσιεύτηκε το Σαββατοκύριακο, τα λεγόμενα μοντέλα μεγάλης συλλογιστικής (Large Reasoning Models – LRM), μια προηγμένη κατηγορία συστημάτων ΤΝ σχεδιασμένων για επίλυση σύνθετων προβλημάτων μέσω αναλυτικών βημάτων σκέψης, υπέστησαν πλήρη κατάρρευση ακρίβειας όταν αντιμετώπισαν προβλήματα αυξημένης πολυπλοκότητας.

Αντίθετα, σε εργασίες χαμηλής δυσκολίας, τα συμβατικά μοντέλα ΤΝ είχαν καλύτερες επιδόσεις. Όμως και οι δύο τύποι μοντέλων εμφάνισαν σημαντικά ελλείμματα σε πιο απαιτητικά σενάρια, με τα LRM να παρουσιάζουν ανησυχητικά σημάδια «παραίτησης» από την προσπάθεια συλλογισμού, καθώς πλησίαζαν το όριο αποτυχίας.

Τεχνητή νοημοσύνη: «Καταστροφικά» τα ευρήματα για την πορεία προς την AGI

Ο Gary Marcus, διακεκριμένος ακαδημαϊκός και ένθερμος επικριτής της υπερεκτίμησης των δυνατοτήτων των LLM (μεγάλα γλωσσικά μοντέλα), χαρακτήρισε τη μελέτη της Apple ως «αρκετά καταστροφική». Όπως σχολίασε:

«Όποιος πιστεύει ότι τα LLM αποτελούν άμεση οδό προς την AGI που θα μεταμορφώσει ριζικά την κοινωνία προς το καλύτερο, κάνει λάθος».

Η μελέτη ανέλυσε πώς τα μοντέλα επιχειρούν την επίλυση προβλημάτων μέσω δομημένης σκέψης, διαπιστώνοντας ότι όσο αυξάνεται η δυσκολία, τόσο μειώνεται η ικανότητά τους να εφαρμόζουν συνεπή λογικά βήματα. Μάλιστα, ακόμα και όταν τους παρέχεται ορθός αλγόριθμος για την επίλυση ενός προβλήματος, αδυνατούν να τον ακολουθήσουν αποτελεσματικά.

Η ερευνητική ομάδα σημειώνει: «Μόλις τα μοντέλα πλησιάσουν ένα κρίσιμο όριο – το οποίο ταυτίζεται με την κατάρρευση της ακρίβειάς τους – αρχίζουν να μειώνουν την προσπάθεια συλλογισμού τους, παρότι τα προβλήματα γίνονται δυσκολότερα».

Αυτό το εύρημα ερμηνεύεται ως ένδειξη θεμελιώδους περιορισμού κλιμάκωσης των γνωστικών δυνατοτήτων των σύγχρονων LRM.

Δοκιμές με γρίφους και γνωστά μοντέλα Τεχνητής Νοημοσύνης

Η μελέτη περιλάμβανε δοκιμές επίλυσης κλασικών γρίφων, όπως ο Πύργος του Ανόι και τα παζλ «διάσχισης ποταμού». Οι ερευνητές αναγνώρισαν ότι η έμφαση στα παζλ αποτελεί έναν περιορισμό της μελέτης, αλλά τόνισαν ότι πρόκειται για αναγνωρισμένα τεστ γνωστικής ικανότητας.

Μεταξύ των μοντέλων που αξιολογήθηκαν ήταν:

  • GPT o3 της OpenAI
  • Gemini Thinking της Google
  • Claude 3.7 Sonnet-Thinking της Anthropic
  • DeepSeek-R1 της DeepSeek

Οι εταιρείες Anthropic, Google και DeepSeek κλήθηκαν να σχολιάσουν τα ευρήματα, ενώ η OpenAI αρνήθηκε να σχολιάσει.

Ο Andrew Rogoyski, του Ινστιτούτου για την Ανθρωποκεντρική Τεχνητή Νοημοσύνη στο Πανεπιστήμιο του Surrey, σημείωσε ότι η μελέτη της Apple υπογραμμίζει τις δομικές αδυναμίες της παρούσας κατεύθυνσης στην ανάπτυξη ΤΝ: «Το γεγονός ότι τα μοντέλα μεγάλης συλλογιστικής χάνουν τη “συνοχή” τους στα πιο σύνθετα προβλήματα, παρότι αποδίδουν καλά στα απλούστερα, υποδηλώνει πως βρισκόμαστε πιθανόν μπροστά σε ένα τεχνολογικό αδιέξοδο».

Η μελέτη καταλήγει στο συμπέρασμα ότι η σημερινή προσέγγιση ανάπτυξης τεχνητής νοημοσύνης ίσως να έχει φτάσει τα όριά της, τουλάχιστον όσον αφορά την ικανότητα γενικευμένης συλλογιστικής - δηλαδή τη δυνατότητα να εφαρμόζεται ένα μεμονωμένο συμπέρασμα σε ευρύτερα πεδία.

Όπως επισημαίνουν οι ερευνητές: «Τα ευρήματά μας αμφισβητούν βασικές παραδοχές για το μέλλον των LRM και υποδεικνύουν ότι οι παρούσες τεχνικές ίσως αντιμετωπίζουν θεμελιώδη εμπόδια στην προσπάθεια για αληθινή γενίκευση σκέψης».


Με πληροφορίες από Guardian

 
 
 
 
Τech & Science
0

ΔΕΙΤΕ ΑΚΟΜΑ

Ερευνητές του Cambridge «παγώνουν» μόριο-κλειδί και δίνουν μεγάλη ελπίδα για την αντιμετώπιση του καρκίνου στον εγκέφαλο

Τech & Science / Ερευνητές του Cambridge «παγώνουν» μόριο-κλειδί και δίνουν μεγάλη ελπίδα για την αντιμετώπιση του καρκίνου στον εγκέφαλο

«Θα μπορούσε να είναι μια πραγματική ευκαιρία να επιβραδύνουμε την εξέλιξη του γλοιοβλαστώματος», υποστηρίζουν με συγκρατημένη αισιοδοξία, καθώς απαιτείται περαιτέρω δοκιμών
LIFO NEWSROOM
Αλτσχάιμερ: Εγκρίθηκε φάρμακο που χορηγείται αποκλειστικά στο σπίτι

Τech & Science / Αλτσχάιμερ: Εγκρίθηκε θεραπεία που μπορεί να χορηγηθεί στο σπίτι από τον ίδιο τον ασθενή

Η έκδοση για χρήση στο σπίτι εγκρίθηκε ως θεραπεία συντήρησης που οι ασθενείς μπορούν να χορηγούν στον εαυτό τους αφού ολοκληρώσουν τον κύκλο της ενδοφλέβιας θεραπείας
LIFO NEWSROOM
«Νέα γενιά εθισμένων»: Τι κινδύνους κρύβει το άτμισμα για τον εγκέφαλο των εφήβων

Τech & Science / «Νέα γενιά εθισμένων»: Τι κινδύνους κρύβει το άτμισμα για τον εγκέφαλο των εφήβων

Οι ειδικοί προειδοποιούν ότι τα ηλεκτρονικά τσιγάρα δημιουργούν νέους εθισμούς στη νικοτίνη και προκαλούν σοβαρούς κινδύνους για την καρδιά, τους πνεύμονες και τον εγκέφαλο των παιδιών και των εφήβων
LIFO NEWSROOM
«Είναι κάπως σαν νίκη για τη Google»: Πώς κατάφερε να γλιτώσει από το να πουλήσει το Chrome

Τech & Science / «Είναι κάπως σαν νίκη για τη Google»: Πώς κατάφερε να γλιτώσει από το να πουλήσει το Chrome

Η απόφαση αυτή θεωρείται μια από τις σημαντικότερες των τελευταίων 20 ετών - Η Google διατηρεί πάντως κάποιες «ανησυχίες» για την υποχρέωσή της να μοιράζεται δεδομένα διαδικτυακών αναζητήσεων
LIFO NEWSROOM
Το James Webb εντόπισε «γυμνή» μαύρη τρύπα από την αυγή του σύμπαντος - «Μία πραγματική ια πρόκληση για τις θεωρίες μας»

Τech & Science / Το James Webb εντόπισε «γυμνή» μαύρη τρύπα από την αυγή του σύμπαντος - «Μία πραγματική πρόκληση για τις θεωρίες μας»

Οι αστρονόμοι εκτιμούν ότι ίσως ανήκει σε μία κατηγορία αντικειμένων που είχε θεωρητικά προβλέψει ο Στίβεν Χόκινγκ, αλλά που μέχρι σήμερα δεν είχε ποτέ εντοπιστεί
LIFO NEWSROOM
Τι είναι το Clanker και γιατί το χρησιμοποιούν οι χρήστες του διαδικτύου ως αντι-AI αργκό;

Τech & Science / Τι είναι το Clanker και γιατί το χρησιμοποιούν οι χρήστες του διαδικτύου ως αντι-AI αργκό;

Ο όρος διαδίδεται στα social media μεταξύ των ανθρώπων που δηλώνουν «κουρασμένοι» με την τεχνητή νοημοσύνη που «εφευρίσκει» πράγματα, ακούγεται υπερβολικά ανθρώπινη και απειλεί να εξαφανίσει θέσεις εργασίας
LIFO NEWSROOM
Από την Amy έως τον Wubbo: Πώς επιλέγουν οι μετεωρολόγοι τα ονόματα των καταιγίδων και γιατί είναι σημαντικά

Τech & Science / Από την Amy μέχρι τον Wubbo: Πώς επιλέγουν οι μετεωρολόγοι τα ονόματα των καταιγίδων και γιατί είναι σημαντικά

«Όταν μια καταιγίδα έχει όνομα, γίνεται πιο εύκολο για τα μέσα ενημέρωσης και το κοινό να μιλούν γι’ αυτήν, να μοιράζονται πληροφορίες και να προετοιμάζονται», εξηγεί η επικεφαλής μετεωρολόγος του Met Office, Rebekah Hicks
LIFO NEWSROOM
Στην Αρχαία Ολυμπία ξεκίνησαν οι πρώτοι «Ολυμπιακοί» των ρομπότ 

Τech & Science / Στην Αρχαία Ολυμπία ξεκίνησαν οι πρώτοι «Ολυμπιακοί» των ρομπότ

Στον ίδιο χώρο όπου πριν από χιλιάδες χρόνια συναθροίζονταν οι Έλληνες αθλητές, αυτή τη φορά συναντήθηκαν ομάδες μηχανικών από τέσσερις ηπείρους, μετατρέποντας την Ολυμπία σε παγκόσμιο εργαστήριο ρομποτικής
LIFO NEWSROOM
Αρχαίο DNA αποκαλύπτει το βακτήριο που προκάλεσε την πρώτη πανδημία στην ιστορία

Τech & Science / Αρχαίο DNA αποκαλύπτει το βακτήριο που προκάλεσε την πρώτη πανδημία στην ιστορία

«Τα ευρήματά μας αποτελούν το κομμάτι που έλειπε από το παζλ, προσφέροντας το πρώτο άμεσο γενετικό 'παράθυρο' στο πώς ξέσπασε αυτή η πανδημία στην καρδιά της αυτοκρατορίας»
LIFO NEWSROOM