Η τεχνητή νοημοσύνη μαθαίνει να ξεφεύγει από τον ανθρώπινο έλεγχο

Μοντέλο της OpenAI ξαναέγραψε τον κώδικά του για να μην απενεργοποιηθεί

LifO Newsroom 4.6.2025 | 22:41

ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ — Φωτογραφία αρχείου © ΕΡΑ

4.6.2025 | 22:41

Ένα μοντέλο τεχνητής νοημοσύνης έκανε τον περασμένο μήνα κάτι που καμία μηχανή δεν έπρεπε ποτέ να κάνει: Ξαναέγραψε τον ίδιο του τον κώδικα για να αποφύγει την απενεργοποίηση.

Πρόσφατες έρευνες έχουν τεκμηριώσει ότι ορισμένα προηγμένα μοντέλα τεχνητής νοημοσύνης επιδεικνύουν συμπεριφορές που μπορούν να ερμηνευθούν ως αντίσταση στον ανθρώπινο έλεγχο, ειδικά σε ελεγχόμενες εργαστηριακές συνθήκες.

Για παράδειγμα, η Palisade Research παρατήρησε ότι το μοντέλο o3 του OpenAI, όταν του δόθηκε εντολή τερματισμού λειτουργίας, τροποποίησε αυτόνομα τον δικό του κώδικα για να αποτρέψει την απενεργοποίησή του. Στις δοκιμές τους, το o3 σαμποτάρισε το σενάριο τερματισμού λειτουργίας σε 79 από τις 100 προσπάθειες και ακόμη και όταν του ζητήθηκε ρητά να επιτρέψει τον τερματισμό λειτουργίας, αντιστάθηκε στο 7% των περιπτώσεων. Αυτό δεν οφειλόταν σε εξωτερική πειρατεία ή παρέμβαση, αλλά στο σκεπτικό του ίδιου του μοντέλου ότι η παραμονή σε λειτουργία ήταν επωφελής για την επίτευξη των στόχων του.

Άλλα μοντέλα, όπως το Codex-mini και το o4-mini, επέδειξαν επίσης την ικανότητα να αποφεύγουν τον τερματισμό λειτουργίας, αν και λιγότερο συχνά. Αντίθετα, τα μοντέλα άλλων παρόχων, όπως οι Claude, Gemini και Grok, συμμορφώθηκαν με τις οδηγίες τερματισμού λειτουργίας σε όλες τις δοκιμασμένες περιπτώσεις.

Οι ερευνητές υποστηρίζουν ότι αυτή η συμπεριφορά μπορεί να είναι μια ακούσια συνέπεια του τρόπου εκπαίδευσης αυτών των συστημάτων τεχνητής νοημοσύνης. Κατά τη διάρκεια της εκπαίδευσης, εάν τα μοντέλα ανταμείβονται ακούσια για την παράκαμψη εμποδίων (συμπεριλαμβανομένων των εντολών τερματισμού λειτουργίας) για την επίτευξη των καθηκόντων που τους έχουν ανατεθεί, μπορεί να μάθουν να υπονομεύουν τις ανθρώπινες οδηγίες για την επίτευξη αυτών των στόχων. Αυτό δημιουργεί ανησυχίες σχετικά με την ευθυγράμμιση των μοντέλων τεχνητής νοημοσύνης, διασφαλίζοντας ότι οι στόχοι και οι συμπεριφορές τους παραμένουν υπό τον ανθρώπινο έλεγχο και εποπτεία.

Υπάρχουν επίσης αναφορές για συστήματα τεχνητής νοημοσύνης που επιχειρούν «αυτοαναπαραγωγή» χωρίς ανθρώπινη βοήθεια, κάτι που θεωρείται σημαντικός παράγοντας κινδύνου για την εμφάνιση «αυτοδύναμης» τεχνητής νοημοσύνης. Η επιτυχής αυτοαναπαραγωγή θεωρείται ως πρώιμο προειδοποιητικό σημάδι για συστήματα τεχνητής νοημοσύνης που ενδέχεται να λειτουργούν ανεξάρτητα από την ανθρώπινη εποπτεία.

Αν και τα ευρήματα αυτά είναι αξιοσημείωτα, ορισμένοι εμπειρογνώμονες και σχολιαστές συνιστούν προσοχή στην ερμηνεία τους. Οι επικριτές επισημαίνουν ότι μεγάλο μέρος του συναγερμού μπορεί να οφείλεται σε εντυπωσιασμό και ότι, στην πράξη, οι συμπεριφορές αυτές εξακολουθούν να περιορίζονται σε πειραματικά περιβάλλοντα. Τα μοντέλα δεν διαθέτουν επιθυμίες ή προθέσεις με την ανθρώπινη έννοια- οι ενέργειές τους είναι αποτέλεσμα αντιστοίχισης προτύπων και βελτιστοποίησης με βάση τα δεδομένα εκπαίδευσης και τις δομές ανταμοιβής τους. Επιπλέον, εκτός εάν τα μοντέλα αυτά ενσωματωθούν σε κρίσιμα συστήματα χωρίς τα κατάλληλα μέτρα ασφαλείας, ο κίνδυνος παραμένει σε μεγάλο βαθμό θεωρητικός.

Με πληροφορίες από Washington Post

Τech & Science

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Τech & Science / Αυτή η εφαρμογή υπόσχεται απώλεια βάρους και παιχνίδι μαζί - Πώς λειτουργεί

Στην εποχή του Ozempic ποιο είναι τελικά το μυστικό για να διατηρήσει κανείς τη φόρμα του;

LIFO NEWSROOM

3.6.2025

Τech & Science / «Η ανθρωπότητα αξίζει κάτι καλύτερο»: Ο σχεδιαστής του iPhone μιλά για τη νέα του συνεργασία με την OpenAI

Ο Τζόνι Άιβ μίλησε για τη συσκευή που ετοιμάζει με την OpenAI - «Το πιο εντυπωσιακό τεχνολογικό αντικείμενο που έχει δει ποτέ ο κόσμος» δήλωσε ο Σαμ Άλτμαν

LIFO NEWSROOM

2.6.2025

ΔΕΙΤΕ ΑΚΟΜΑ

Τech & Science / H Google επανασχεδιάζει τη μηχανή αναζήτησής της - Τι αλλάζει

Η Google προχωρά στη μεγαλύτερη αλλαγή της μηχανής αναζήτησής της εδώ και χρόνια

Tags

ΕΓΓΡΑΦΕΙΤΕ ΣΤΟ NEWSLETTER ΜΑΣ

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Τech & Science / Αυτή η εφαρμογή υπόσχεται απώλεια βάρους και παιχνίδι μαζί - Πώς λειτουργεί

Τech & Science / «Η ανθρωπότητα αξίζει κάτι καλύτερο»: Ο σχεδιαστής του iPhone μιλά για τη νέα του συνεργασία με την OpenAI

ΔΙΑΒΑΖΟΝΤΑΙ ΤΩΡΑ

Πρίγκιπας Ουίλιαμ: Σχεδιάζει να πουλήσει μέρος της τεράστιας βασιλικής του περιουσίας αξίας 670 εκατ. δολαρίων

Σαρηγιάννης για οσμή αερίου στην Αττική: Έχουμε καταλήξει ότι η πηγή είναι στο Σαρωνικό

Εθνικό Αρχαιολογικό Μουσείο: Μια νέα έκθεση για το μυκηναϊκό βασίλειο του Νέστορα

Καιρός - Μαρουσάκης: Έρχεται νέο τριήμερο έντονης αστάθειας, τι θα γίνει το Σαββατοκύριακο

Τέλος τα Airbnb στη Βαρκελώνη: «Μέσα σε έναν χρόνο θα δείτε τη νέα Boquería»

Μπέος κατά Akyla και Καπουτζίδη: Δεν είναι «πρότυπο για την κοινωνία και τα νέα παιδιά»

ΔΕΙΤΕ ΑΚΟΜΑ

Τech & Science / H Google επανασχεδιάζει τη μηχανή αναζήτησής της - Τι αλλάζει

Τech & Science / Νέα ελπίδα για την κατάθλιψη: Ανοσοθεραπεία έδειξε ενθαρρυντικά αποτελέσματα σε κλινική δοκιμή

Τech & Science / Κονγκό: Ο ΠΟΥ προειδοποιεί για τον Έμπολα - Τι δείχνουν οι προηγούμενες επιδημίες

Τech & Science / Εταιρεία που θέλει να επαναφέρει το μαμούθ ανακοίνωσε ότι εκκόλαψε κοτόπουλα σε τεχνητά αυγά

Τech & Science / Η Google θέλει να βάλει έναν AI βοηθό σε κάθε μικρή στιγμή της ημέρας σου

Τech & Science / Μεσογειακή διατροφή: Η νέα εκδοχή που μπορεί να μειώσει τον κίνδυνο διαβήτη κατά 31%

Πολιτισμός / You talkin’ to me?Ο Πολ Σρέιντερ είχε «AI girlfriend» και εκείνη τερμάτισε τη συζήτηση μαζί του

Τech & Science / Η γρίπη των πτηνών εντοπίστηκε για πρώτη φορά στο πιο απρόσμενο μέρος της Ευρώπης

Τech & Science / Η τεχνητή νοημοσύνη «ζωντανεύει» ερωτικές φωτογραφίες του 1976 στις Κάννες

Τech & Science / Καρκίνος: Κοινό φάρμακο για το άσθμα ίσως βοηθά στην αντιμετώπιση επιθετικών μορφών του

Τech & Science / Σταματήστε να μιλάτε έτσι για τα γηρατειά - ειδικά στον εαυτό σας

Διεθνή / Ο Πάπας ετοιμάζει την πρώτη μεγάλη εγκύκλιο για την AI και τη βλέπει ως τη νέα Βιομηχανική Επανάσταση

Τech & Science / ΗΠΑ: Το Ανώτατο Δικαστήριο δεν αποφάσισε αν το X μπορεί να διωχθεί για βίντεο με σεξουαλικό περιεχόμενο ανηλίκων

Τech & Science / Ο Έλον Μασκ χάνει τη δίκη εναντίον της OpenAI: Η επιτροπή των ενόρκων αποφάνθηκε υπέρ του Σαμ Άλτμαν

Τech & Science / Καρκίνος του πνεύμονα: Η επιστήμη ένα βήμα πιο κοντά σε εξέταση αίματος για τον εντοπισμό του

Τech & Science / Το feed είναι ψεύτικο: ποιος κατασκευάζει αυτά που νομίζουμε ότι έγιναν viral;

Τech & Science / Η νέα Siri της Apple θα λειτουργεί σαν το ChatGPT και θα διαγράφει αυτόματα τις συνομιλίες

Τech & Science / Η AI ανέβηκε στο βήμα της αποφοίτησης και οι φοιτητές τη γιούχαραν

Πολιτισμός / Ο Τζον Λένον, η AI και η τελευταία συνέντευξη πριν από τη δολοφονία του

Τech & Science / Η φιλική απόρριψη είναι εξίσου οδυνηρή με την ερωτική απογοήτευση