Τα προηγμένα μοντέλα τεχνητής νοημοσύνης καταρρέουν μπροστά σε σύνθετα προβλήματα, δείχνει έρευνα

Τα μοντέλα μεγάλης συλλογιστικής υπέστησαν πλήρη κατάρρευση όταν αντιμετώπισαν προβλήματα αυξημένης πολυπλοκότητας

LifO Newsroom 9.6.2025 | 20:37

Τα προηγμένα μοντέλα τεχνητής νοημοσύνης καταρρέουν μπροστά σε σύνθετα προβλήματα, δείχνει έρευνα — Η προηγμένη τεχνητή νοημοσύνη δεν κατόρθωσε να λύσει περίπλκα προβλήματα / Φωτογραφία: Freepik.com

9.6.2025 | 20:37

Μια νέα μελέτη της Apple αποκαλύπτει σοβαρούς περιορισμούς στις δυνατότητες των πιο εξελιγμένων μοντέλων τεχνητής νοημοσύνης, αμφισβητώντας τις κυρίαρχες προσδοκίες της τεχνολογικής βιομηχανίας για την επίτευξη τεχνητής γενικής νοημοσύνης (AGI).

Σύμφωνα με την έρευνα που δημοσιεύτηκε το Σαββατοκύριακο, τα λεγόμενα μοντέλα μεγάλης συλλογιστικής (Large Reasoning Models – LRM), μια προηγμένη κατηγορία συστημάτων ΤΝ σχεδιασμένων για επίλυση σύνθετων προβλημάτων μέσω αναλυτικών βημάτων σκέψης, υπέστησαν πλήρη κατάρρευση ακρίβειας όταν αντιμετώπισαν προβλήματα αυξημένης πολυπλοκότητας.

Αντίθετα, σε εργασίες χαμηλής δυσκολίας, τα συμβατικά μοντέλα ΤΝ είχαν καλύτερες επιδόσεις. Όμως και οι δύο τύποι μοντέλων εμφάνισαν σημαντικά ελλείμματα σε πιο απαιτητικά σενάρια, με τα LRM να παρουσιάζουν ανησυχητικά σημάδια «παραίτησης» από την προσπάθεια συλλογισμού, καθώς πλησίαζαν το όριο αποτυχίας.

Τεχνητή νοημοσύνη: «Καταστροφικά» τα ευρήματα για την πορεία προς την AGI

Ο Gary Marcus, διακεκριμένος ακαδημαϊκός και ένθερμος επικριτής της υπερεκτίμησης των δυνατοτήτων των LLM (μεγάλα γλωσσικά μοντέλα), χαρακτήρισε τη μελέτη της Apple ως «αρκετά καταστροφική». Όπως σχολίασε:

«Όποιος πιστεύει ότι τα LLM αποτελούν άμεση οδό προς την AGI που θα μεταμορφώσει ριζικά την κοινωνία προς το καλύτερο, κάνει λάθος».

Η μελέτη ανέλυσε πώς τα μοντέλα επιχειρούν την επίλυση προβλημάτων μέσω δομημένης σκέψης, διαπιστώνοντας ότι όσο αυξάνεται η δυσκολία, τόσο μειώνεται η ικανότητά τους να εφαρμόζουν συνεπή λογικά βήματα. Μάλιστα, ακόμα και όταν τους παρέχεται ορθός αλγόριθμος για την επίλυση ενός προβλήματος, αδυνατούν να τον ακολουθήσουν αποτελεσματικά.

Η ερευνητική ομάδα σημειώνει: «Μόλις τα μοντέλα πλησιάσουν ένα κρίσιμο όριο – το οποίο ταυτίζεται με την κατάρρευση της ακρίβειάς τους – αρχίζουν να μειώνουν την προσπάθεια συλλογισμού τους, παρότι τα προβλήματα γίνονται δυσκολότερα».

Αυτό το εύρημα ερμηνεύεται ως ένδειξη θεμελιώδους περιορισμού κλιμάκωσης των γνωστικών δυνατοτήτων των σύγχρονων LRM.

Δοκιμές με γρίφους και γνωστά μοντέλα Τεχνητής Νοημοσύνης

Η μελέτη περιλάμβανε δοκιμές επίλυσης κλασικών γρίφων, όπως ο Πύργος του Ανόι και τα παζλ «διάσχισης ποταμού». Οι ερευνητές αναγνώρισαν ότι η έμφαση στα παζλ αποτελεί έναν περιορισμό της μελέτης, αλλά τόνισαν ότι πρόκειται για αναγνωρισμένα τεστ γνωστικής ικανότητας.

Μεταξύ των μοντέλων που αξιολογήθηκαν ήταν:

GPT o3 της OpenAI
Gemini Thinking της Google
Claude 3.7 Sonnet-Thinking της Anthropic
DeepSeek-R1 της DeepSeek

Οι εταιρείες Anthropic, Google και DeepSeek κλήθηκαν να σχολιάσουν τα ευρήματα, ενώ η OpenAI αρνήθηκε να σχολιάσει.

Ο Andrew Rogoyski, του Ινστιτούτου για την Ανθρωποκεντρική Τεχνητή Νοημοσύνη στο Πανεπιστήμιο του Surrey, σημείωσε ότι η μελέτη της Apple υπογραμμίζει τις δομικές αδυναμίες της παρούσας κατεύθυνσης στην ανάπτυξη ΤΝ: «Το γεγονός ότι τα μοντέλα μεγάλης συλλογιστικής χάνουν τη “συνοχή” τους στα πιο σύνθετα προβλήματα, παρότι αποδίδουν καλά στα απλούστερα, υποδηλώνει πως βρισκόμαστε πιθανόν μπροστά σε ένα τεχνολογικό αδιέξοδο».

Η μελέτη καταλήγει στο συμπέρασμα ότι η σημερινή προσέγγιση ανάπτυξης τεχνητής νοημοσύνης ίσως να έχει φτάσει τα όριά της, τουλάχιστον όσον αφορά την ικανότητα γενικευμένης συλλογιστικής - δηλαδή τη δυνατότητα να εφαρμόζεται ένα μεμονωμένο συμπέρασμα σε ευρύτερα πεδία.

Όπως επισημαίνουν οι ερευνητές: «Τα ευρήματά μας αμφισβητούν βασικές παραδοχές για το μέλλον των LRM και υποδεικνύουν ότι οι παρούσες τεχνικές ίσως αντιμετωπίζουν θεμελιώδη εμπόδια στην προσπάθεια για αληθινή γενίκευση σκέψης».

Με πληροφορίες από Guardian

Τech & Science

ΔΕΙΤΕ ΑΚΟΜΑ

Τech & Science / HIV: Νέα θεραπεία σε ένα μόνο χάπι φέρνει ελπίδα για όσους ζουν δεκαετίες με τον ιό

Η μελέτη, που δημοσιεύθηκε στο περιοδικό The Lancet, περιέλαβε περισσότερα από 550 άτομα με HIV σε 15 χώρες

No.1

Αναγνωσιμότητες Focus-Bari 2026: Σταθερά πρώτη και φέτος η LiFO

Τεχνητή νοημοσύνη: «Καταστροφικά» τα ευρήματα για την πορεία προς την AGI

Δοκιμές με γρίφους και γνωστά μοντέλα Τεχνητής Νοημοσύνης

Tags

No.1

Αναγνωσιμότητες Focus-Bari 2026: Σταθερά πρώτη και φέτος η LiFO

ΕΓΓΡΑΦΕΙΤΕ ΣΤΟ NEWSLETTER ΜΑΣ

ΔΙΑΒΑΖΟΝΤΑΙ ΤΩΡΑ

HIV: Νέα θεραπεία σε ένα μόνο χάπι φέρνει ελπίδα για όσους ζουν δεκαετίες με τον ιό

Κριστίνα Άπλγκεϊτ για τη σκλήρυνση κατά πλάκας: «Περνάω τις περισσότερες μέρες μου στο κρεβάτι»

Εξαφάνιση Λόρα: Όσα θα εξετάσουν και θα ρωτήσουν οι αρχές τη 16χρονη

Απεργία για τα Τέμπη: Πώς θα κινηθούν στις 28 Φεβρουαρίου μετρό, ηλεκτρικός, τραμ

Ανώνυμος δωρητής έστειλε 21 κιλά χρυσού στην Οσάκα για να φτιάξει το δίκτυο ύδρευσης

Δολιοφθορά στη γραμμή Αθήνα-Θεσσαλονίκη: Το ελληνικό FBI στις έρευνες - Τι εξετάζεται

ΔΕΙΤΕ ΑΚΟΜΑ

Τech & Science / HIV: Νέα θεραπεία σε ένα μόνο χάπι φέρνει ελπίδα για όσους ζουν δεκαετίες με τον ιό

Τech & Science / Ένας από τους μικρότερους δεινόσαυρους ανακαλύφθηκε στην Αργεντινή

Τech & Science / Η γραφή ίσως ξεκίνησε 45.000 χρόνια νωρίτερα απ’ όσο πιστεύαμε

Τech & Science / Ιαπωνία: Παρουσίασε τον Buddharoid, το ρομπότ-μοναχό με AI που απαντά σε υπαρξιακά ερωτήματα

Τech & Science / Το Instagram θα ειδοποιεί τους γονείς εάν τα παιδιά αναζητούν όρους σχετικούς με την αυτοκτονία

Τech & Science / Τροπικά φυτά ανθίζουν με καθυστέρηση ή πρόωρα λόγω της κλιματικής κρίσης

Τech & Science / Η ξηροφθαλμία μπορεί να υποδηλώνει κάτι σοβαρότερο από έναν απλό ερεθισμό των ματιών

Τech & Science / Αγγλία: Σφάλμα σε σύστημα αναγνώρισης προσώπου έστειλε αθώο στο κρατητήριο

Τech & Science / Νέα φωτογραφία του Γαλαξία μάς βοηθά να κατανοήσουμε την καταγωγή των αστεριών

Τech & Science / Καθηγητής της Οξφόρδης εξηγεί γιατί ο Punch συγκινεί τους ανθρώπους

Τech & Science / Μηνιγγίτιδα: Τι είναι, ποια τα συμπτώματα και πότε πρέπει να πάτε νοσοκομείο

Τech & Science / Η όραση ίσως ξεκίνησε από έναν «Κύκλωπα» πριν 560 εκατ. χρόνια, σύμφωνα με έρευνα

Τech & Science / Η άνοδος της θερμοκρασίας των ωκεανών προκαλεί δραματική μείωση της θαλάσσιας ζωής

Τech & Science / Πώς δημιουργήθηκε η ζωή στη Γη; Νέα στοιχεία από εργαστήριο στο Κέιμπριτζ

Τech & Science / Χοληστερίνη: 10 τροφές που συμβάλλουν στη μείωση της LDL

Τech & Science / Πώς τα «έξυπνα γυαλιά» της Meta «απειλούν» τις γυναίκες

Τech & Science / Επιστήμονες ανακάλυψαν πώς χλιμιντρίζουν τα άλογα

Τech & Science / Βρετανία: Πρόστιμο 14,47 εκατ. στο Reddit για ανεπαρκείς ελέγχους ηλικίας

Τech & Science / Πώς η παρατήρηση πτηνών μπορεί να ενισχύσει τη μνήμη και την προσοχή

Τech & Science / Artemis II: Νέο τεχνικό πρόβλημα καθυστερεί τη σεληνιακή αποστολή της NASA