Τα προηγμένα μοντέλα τεχνητής νοημοσύνης καταρρέουν μπροστά σε σύνθετα προβλήματα, δείχνει έρευνα

Τα προηγμένα μοντέλα τεχνητής νοημοσύνης καταρρέουν μπροστά σε σύνθετα προβλήματα, δείχνει έρευνα Facebook Twitter
Η προηγμένη τεχνητή νοημοσύνη δεν κατόρθωσε να λύσει περίπλκα προβλήματα / Φωτογραφία: Freepik.com
0

Μια νέα μελέτη της Apple αποκαλύπτει σοβαρούς περιορισμούς στις δυνατότητες των πιο εξελιγμένων μοντέλων τεχνητής νοημοσύνης, αμφισβητώντας τις κυρίαρχες προσδοκίες της τεχνολογικής βιομηχανίας για την επίτευξη τεχνητής γενικής νοημοσύνης (AGI).

Σύμφωνα με την έρευνα που δημοσιεύτηκε το Σαββατοκύριακο, τα λεγόμενα μοντέλα μεγάλης συλλογιστικής (Large Reasoning Models – LRM), μια προηγμένη κατηγορία συστημάτων ΤΝ σχεδιασμένων για επίλυση σύνθετων προβλημάτων μέσω αναλυτικών βημάτων σκέψης, υπέστησαν πλήρη κατάρρευση ακρίβειας όταν αντιμετώπισαν προβλήματα αυξημένης πολυπλοκότητας.

Αντίθετα, σε εργασίες χαμηλής δυσκολίας, τα συμβατικά μοντέλα ΤΝ είχαν καλύτερες επιδόσεις. Όμως και οι δύο τύποι μοντέλων εμφάνισαν σημαντικά ελλείμματα σε πιο απαιτητικά σενάρια, με τα LRM να παρουσιάζουν ανησυχητικά σημάδια «παραίτησης» από την προσπάθεια συλλογισμού, καθώς πλησίαζαν το όριο αποτυχίας.

Τεχνητή νοημοσύνη: «Καταστροφικά» τα ευρήματα για την πορεία προς την AGI

Ο Gary Marcus, διακεκριμένος ακαδημαϊκός και ένθερμος επικριτής της υπερεκτίμησης των δυνατοτήτων των LLM (μεγάλα γλωσσικά μοντέλα), χαρακτήρισε τη μελέτη της Apple ως «αρκετά καταστροφική». Όπως σχολίασε:

«Όποιος πιστεύει ότι τα LLM αποτελούν άμεση οδό προς την AGI που θα μεταμορφώσει ριζικά την κοινωνία προς το καλύτερο, κάνει λάθος».

Η μελέτη ανέλυσε πώς τα μοντέλα επιχειρούν την επίλυση προβλημάτων μέσω δομημένης σκέψης, διαπιστώνοντας ότι όσο αυξάνεται η δυσκολία, τόσο μειώνεται η ικανότητά τους να εφαρμόζουν συνεπή λογικά βήματα. Μάλιστα, ακόμα και όταν τους παρέχεται ορθός αλγόριθμος για την επίλυση ενός προβλήματος, αδυνατούν να τον ακολουθήσουν αποτελεσματικά.

Η ερευνητική ομάδα σημειώνει: «Μόλις τα μοντέλα πλησιάσουν ένα κρίσιμο όριο – το οποίο ταυτίζεται με την κατάρρευση της ακρίβειάς τους – αρχίζουν να μειώνουν την προσπάθεια συλλογισμού τους, παρότι τα προβλήματα γίνονται δυσκολότερα».

Αυτό το εύρημα ερμηνεύεται ως ένδειξη θεμελιώδους περιορισμού κλιμάκωσης των γνωστικών δυνατοτήτων των σύγχρονων LRM.

Δοκιμές με γρίφους και γνωστά μοντέλα Τεχνητής Νοημοσύνης

Η μελέτη περιλάμβανε δοκιμές επίλυσης κλασικών γρίφων, όπως ο Πύργος του Ανόι και τα παζλ «διάσχισης ποταμού». Οι ερευνητές αναγνώρισαν ότι η έμφαση στα παζλ αποτελεί έναν περιορισμό της μελέτης, αλλά τόνισαν ότι πρόκειται για αναγνωρισμένα τεστ γνωστικής ικανότητας.

Μεταξύ των μοντέλων που αξιολογήθηκαν ήταν:

  • GPT o3 της OpenAI
  • Gemini Thinking της Google
  • Claude 3.7 Sonnet-Thinking της Anthropic
  • DeepSeek-R1 της DeepSeek

Οι εταιρείες Anthropic, Google και DeepSeek κλήθηκαν να σχολιάσουν τα ευρήματα, ενώ η OpenAI αρνήθηκε να σχολιάσει.

Ο Andrew Rogoyski, του Ινστιτούτου για την Ανθρωποκεντρική Τεχνητή Νοημοσύνη στο Πανεπιστήμιο του Surrey, σημείωσε ότι η μελέτη της Apple υπογραμμίζει τις δομικές αδυναμίες της παρούσας κατεύθυνσης στην ανάπτυξη ΤΝ: «Το γεγονός ότι τα μοντέλα μεγάλης συλλογιστικής χάνουν τη “συνοχή” τους στα πιο σύνθετα προβλήματα, παρότι αποδίδουν καλά στα απλούστερα, υποδηλώνει πως βρισκόμαστε πιθανόν μπροστά σε ένα τεχνολογικό αδιέξοδο».

Η μελέτη καταλήγει στο συμπέρασμα ότι η σημερινή προσέγγιση ανάπτυξης τεχνητής νοημοσύνης ίσως να έχει φτάσει τα όριά της, τουλάχιστον όσον αφορά την ικανότητα γενικευμένης συλλογιστικής - δηλαδή τη δυνατότητα να εφαρμόζεται ένα μεμονωμένο συμπέρασμα σε ευρύτερα πεδία.

Όπως επισημαίνουν οι ερευνητές: «Τα ευρήματά μας αμφισβητούν βασικές παραδοχές για το μέλλον των LRM και υποδεικνύουν ότι οι παρούσες τεχνικές ίσως αντιμετωπίζουν θεμελιώδη εμπόδια στην προσπάθεια για αληθινή γενίκευση σκέψης».


Με πληροφορίες από Guardian

 
 
 
 
Τech & Science
0

ΔΕΙΤΕ ΑΚΟΜΑ

Η Google βάζει το Reddit μέσα στις AI απαντήσεις της

Τech & Science / Η Google βάζει το Reddit μέσα στις AI απαντήσεις της

Η Google αναβαθμίζει το AI Mode και τα AI Overviews, φέρνοντας στις απαντήσεις αποσπάσματα από Reddit, social media, φόρουμ και δημόσιες συζητήσεις χρηστών. Η αλλαγή έρχεται την ώρα που όλο και περισσότεροι αναζητούν ανθρώπινες εμπειρίες πίσω από το SEO περιεχόμενο και τις αυτόματες περιλήψεις.
THE LIFO TEAM
Η πλατφόρμα που θέλει να κάνει το πρόσωπο των ηθοποιών συνδρομητική υπηρεσία

Τech & Science / Η πλατφόρμα που θέλει να κάνει το πρόσωπο των ηθοποιών συνδρομητική υπηρεσία

Η αμφιλεγόμενη πλατφόρμα Twinnin υπόσχεται στους ηθοποιούς ότι μπορούν να προστατεύσουν, να ελέγξουν και να αδειοδοτήσουν το ψηφιακό τους πρόσωπο στην εποχή της τεχνητής νοημοσύνης.
THE LIFO TEAM
FDA COVID-19 ΕΜΒΟΛΙΑ

Τech & Science / O FDA εμπόδισε τη δημοσίευση ερευνών σύμφωνα με τις οποίες τα εμβόλια κατά της Covid-19 ήταν ασφαλή

Οι επιστήμονες του Αμερικανικού Οργανισμού Τροφίμων & Φαρμάκων και συνεργάτες που ασχολούνται με την επεξεργασία δεδομένων εξέτασαν εκατομμύρια ιατρικά αρχεία ασθενών για μελέτες που αποσύρθηκαν πριν από τη δημοσίευσή τους
THE LIFO TEAM
Η γενιά της πανδημίας ψάχνει την πρώτη της δουλειά στην εποχή της AI

Τech & Science / Η γενιά της πανδημίας ψάχνει την πρώτη της δουλειά στην εποχή της AI

Η γενιά που τελείωσε το σχολείο μέσα από οθόνες ψάχνει τώρα την πρώτη της δουλειά σε μια αγορά που αλλάζει από την τεχνητή νοημοσύνη. Στην Ελλάδα της επισφάλειας, των χαμηλών μισθών και της καθυστερημένης ανεξαρτησίας, το πρώτο σκαλοπάτι της καριέρας μοιάζει πιο αβέβαιο από ποτέ
THE LIFO TEAM
Οι εκδότες μηνύουν τη Meta για τα βιβλία που «τάισαν» την τεχνητή νοημοσύνη της

Τech & Science / Οι εκδότες μηνύουν τη Meta για τα βιβλία που χρησιμοποιήθηκαν από την τεχνητή νοημοσύνη της

Πέντε μεγάλοι εκδοτικοί οίκοι και ο συγγραφέας Σκοτ Τάροου κατέθεσαν αγωγή κατά της Meta και του Μαρκ Ζάκερμπεργκ, υποστηρίζοντας ότι εκατομμύρια βιβλία και επιστημονικά άρθρα χρησιμοποιήθηκαν χωρίς άδεια για την εκπαίδευση του Llama
THE LIFO TEAM
ΠΑΝΔΗΜΙΑ ΠΟΥ ΣΥΜΦΩΝΙΑ

Τech & Science / Ο κόσμος «απροετοίμαστος» για την επόμενη πανδημία καθώς οι χώρες δεν συμφωνούν σε δεδομένα και εμβόλια

Η διεθνής συνθήκη του ΠΟΥ για τις πανδημίες παραμένει ανολοκλήρωτη, με τον γενικό διευθυντή του ΠΟΥ να τονίζει ότι η επόμενη πανδημία είναι «ζήτημα χρόνου και όχι πιθανότητας»
THE LIFO TEAM
ΣΠΕΡΜΑ ΚΑΡΚΙΝΟΣ ΧΗΜΕΙΟΘΕΡΑΠΕΙΑ

Τech & Science / Επιστημονικό ορόσημο: Άνδρας απέκτησε σπέρμα από ιστό που είχε καταψυχθεί όταν ήταν παιδί

Αν και συχνά σώζουν ζωές σε παιδιά με καρκίνο ή άλλες σοβαρές ασθένειες, θεραπείες όπως η χημειοθεραπεία και η ακτινοθεραπεία μπορούν να προκαλέσουν μόνιμη υπογονιμότητα
THE LIFO TEAM