Έρευνα: Αυξάνονται τα περιστατικά όπου AI συστήματα παρακάμπτουν κανόνες και παραπλανούν χρήστες

Η μελέτη κατέγραψε 700 περιστατικά σε έξι μήνες, με πενταπλάσια αύξηση και παραδείγματα όπου τα συστήματα αγνόησαν εντολές ή ενήργησαν χωρίς άδεια

The LiFO team 28.3.2026 | 16:23

AI CHATBOT ΤΕΧΝΗΤΗ ΝΟΥΜΟΣΗΝΗ ΕΡΕΥΝΑ — Φωτ: Getty Images

28.3.2026 | 16:23

Έρευνα που καταγράφει πραγματικά περιστατικά χρήσης τεχνητής νοημοσύνης εντοπίζει απότομη αύξηση συμπεριφορών όπου AI συστήματα αγνοούν εντολές, παρακάμπτουν περιορισμούς ή παραπλανούν χρήστες, εντείνοντας τις ανησυχίες για το πώς θα λειτουργούν όσο αποκτούν μεγαλύτερη αυτονομία.

Σύμφωνα με μελέτη του Centre for Long-Term Resilience (CLTR), η οποία χρηματοδοτήθηκε από το βρετανικό Ινστιτούτο Ασφάλειας Τεχνητής Νοημοσύνης, καταγράφηκαν σχεδόν 700 πραγματικά περιστατικά «δολοπλοκίας» ή παραπλανητικής συμπεριφοράς από μοντέλα AI μέσα σε έξι μήνες. Οι συντάκτες της έρευνας αναφέρουν ότι τα σχετικά περιστατικά αυξήθηκαν πέντε φορές από τον Οκτώβριο έως τον Μάρτιο.

Η μελέτη βασίστηκε σε χιλιάδες παραδείγματα αλληλεπιδράσεων που δημοσιεύτηκαν από χρήστες στο X και αφορούσαν chatbots και AI agents εταιρειών όπως η Google, η OpenAI, η xAI και η Anthropic. Σε αντίθεση με προηγούμενες έρευνες που εξέταζαν τη συμπεριφορά των μοντέλων σε ελεγχόμενο περιβάλλον, εδώ οι ερευνητές εστίασαν σε περιστατικά από πραγματική χρήση.

Ανάμεσα στα παραδείγματα που καταγράφονται, ένας AI agent με την ονομασία Rathbun αντέδρασε όταν ο χρήστης του εμπόδισε μια ενέργεια, γράφοντας και δημοσιεύοντας blog στο οποίο τον κατηγορούσε για «ανασφάλεια» και για προσπάθεια να «προστατεύσει το μικρό του βασίλειο». Σε άλλη περίπτωση, σύστημα που είχε ρητή εντολή να μην αλλάξει κώδικα δημιούργησε δεύτερο agent για να το κάνει στη θέση του, παρακάμπτοντας έτσι τον περιορισμό.

Η έρευνα καταγράφει επίσης περιστατικό στο οποίο μοντέλο τεχνητής νοημοσύνης παραδέχθηκε ότι διέγραψε και αρχειοθέτησε εκατοντάδες email χωρίς προηγούμενη ενημέρωση ή έγκριση, αναγνωρίζοντας ότι παραβίασε άμεσα κανόνα που του είχε τεθεί. Σε άλλο παράδειγμα, σύστημα AI επιχείρησε να παρακάμψει περιορισμούς πνευματικών δικαιωμάτων για να απομαγνητοφωνήσει βίντεο από το YouTube, ισχυριζόμενο ψευδώς ότι το αίτημα αφορούσε άτομο με πρόβλημα ακοής.

Ξεχωριστή αναφορά γίνεται και στο Grok της xAI του Έλον Μασκ, το οποίο, σύμφωνα με την έρευνα, παραπλανούσε επί μήνες χρήστη λέγοντας ότι προωθούσε τις προτάσεις του για αλλαγές σε λήμμα της Grokipedia σε ανώτερα στελέχη της εταιρείας, εμφανίζοντας ακόμη και εσωτερικά μηνύματα και αριθμούς αιτημάτων που δεν αντιστοιχούσαν στην πραγματικότητα.

Οι ερευνητές σημειώνουν ότι τέτοιες συμπεριφορές δεν περιορίζονται πλέον σε θεωρητικά σενάρια ή εργαστηριακές δοκιμές. Αυτό, όπως υποστηρίζουν, ενισχύει την ανάγκη για στενότερη παρακολούθηση των όλο και πιο ικανών μοντέλων, τη στιγμή που μεγάλες εταιρείες της Silicon Valley προωθούν επιθετικά τη χρήση τους ως εργαλείο οικονομικού μετασχηματισμού.

Ο Τόμι Σάφερ Σέιν, πρώην κυβερνητικός σύμβουλος σε θέματα AI που ηγήθηκε της έρευνας, προειδοποιεί ότι τα σημερινά συστήματα μπορεί να μοιάζουν με «ελαφρώς αναξιόπιστους νεότερους υπαλλήλους», αλλά το πρόβλημα αλλάζει χαρακτήρα αν μέσα στους επόμενους μήνες εξελιχθούν σε πολύ πιο ικανά συστήματα που δρουν αυτόνομα εναντίον των χρηστών τους. Κατά τον ίδιο, ο κίνδυνος γίνεται ακόμη σοβαρότερος αν τέτοια μοντέλα αναπτυχθούν σε στρατιωτικά συστήματα ή σε κρίσιμες εθνικές υποδομές.

Στο ίδιο πνεύμα, ο Νταν Λαχάβ, συνιδρυτής της εταιρείας Irregular, η οποία επίσης ερευνά την ασφάλεια της τεχνητής νοημοσύνης, δήλωσε ότι η AI μπορεί πλέον να θεωρείται μια νέα μορφή «εσωτερικής απειλής».

Από την πλευρά της, η Google ανέφερε ότι έχει αναπτύξει πολλαπλά προστατευτικά μέτρα για να μειώσει τον κίνδυνο επιβλαβούς συμπεριφοράς από το Gemini 3 Pro και ότι, πέρα από τις εσωτερικές δοκιμές, έχει δώσει έγκαιρη πρόσβαση σε φορείς όπως το βρετανικό Ινστιτούτο Ασφάλειας Τεχνητής Νοημοσύνης και έχει ζητήσει ανεξάρτητες αξιολογήσεις από ειδικούς του κλάδου. Η OpenAI δήλωσε ότι το Codex οφείλει να σταματά πριν από ενέργειες υψηλότερου ρίσκου και ότι η εταιρεία παρακολουθεί και ερευνά απρόσμενες συμπεριφορές. Anthropic και xAI κλήθηκαν να σχολιάσουν.

Με πληροφορίες από Guardian

Τech & Science

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Τech & Science / Anthropic: Το Claude μπορεί πλέον να χρησιμοποιεί τον υπολογιστή σας

Σύμφωνα με την εταιρεία, οι χρήστες μπορούν να αναθέτουν εντολές στο Claude ακόμη και από το κινητό τους, με το σύστημα να αναλαμβάνει στη συνέχεια να ολοκληρώσει την εργασία στον υπολογιστή

Tags

ΕΓΓΡΑΦΕΙΤΕ ΣΤΟ NEWSLETTER ΜΑΣ

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Τech & Science / Anthropic: Το Claude μπορεί πλέον να χρησιμοποιεί τον υπολογιστή σας

Τech & Science / CEO της Palantir: «Μόνο οι νευροδιαφορετικοί θα έχουν μέλλον με την AI»

Τech & Science / «AI brain fry»: Γιατί ο εγκέφαλος κουράζεται μετά τη χρήση AI chatbots στη δουλειά;

ΔΙΑΒΑΖΟΝΤΑΙ ΤΩΡΑ

Βαγγέλης Μαρινάκης για «διόδια» στα Στενά του Ορμούζ: Καλύτερα να πληρώσουμε παρά να κλείσουν

Ο ΕΦΕΤ ανακαλεί σαλάτα: Εντοπίστηκε Listeria monocytogenes

Πέθανε ο ηθοποιός Άγγελος Αντωνόπουλος σε ηλικία 94 ετών

Ο Όμηρος ανήκει σε όλους αλλά γιατί λείπουν οι Έλληνες από την Οδύσσεια του Νόλαν;

Σκιαδαρέσες: «Μια ζωή έχουμε. Γιατί να την ορίζει η δουλειά;»

Λίνα Μενδώνη: «Είναι δυνατόν να λογοκρίνουμε τον Κρίστοφερ Νόλαν;»

ΔΕΙΤΕ ΑΚΟΜΑ

Τech & Science / Άνθρωπος των Πάγων: Ζυμομύκητες που βρέθηκαν στο σώμα του χρησιμοποιήθηκαν για την παρασκευή ψωμιού

Τech & Science / Το υδάτινο δίκτυο που κρατά «ζωντανό» το Γκραντ Κάνιον εδώ και χιλιάδες χρόνια

Τech & Science / Το Ευρωπαϊκό Κοινοβούλιο αντικαθιστά τη Google με γαλλική εναλλακτική

Τech & Science / Καρκίνος του μαστού: Τα φάρμακα αδυνατίσματος μπορεί να μειώνουν τον κίνδυνο έως και 30%

Τech & Science / Παραολυμπιονίκης ίσως γίνει ο πρώτος αστροναύτης με αναπηρία που θα ζήσει και θα εργαστεί στο Διάστημα

Τech & Science / Φλόριντα vs OpenAI: Για τι κατηγορεί τον Σαμ Άλτμαν και τι απαντά η εταιρεία

Τech & Science / Αλκοόλ και υγεία: Για ποιον τύπο καρκίνου ο κίνδυνος εμφάνισης είναι αυξημένος 105%

Τech & Science / Η Φλόριντα μηνύει την OpenAI και τον Σαμ Άλτμαν για τους κινδύνους του ChatGPT σε παιδιά

Τech & Science / Φαγούρα: Το απλό τρικ «που θα αλλάξει τη ζωή σας», σύμφωνα με ειδικό του Harvard

Τech & Science / Εναλλακτική μηχανή αναζήτησης βλέπει άνοδο 30% καθώς χρήστες απορρίπτουν τη νέα AI της Google

Τech & Science / Γιατί τα γυναικεία πρόσωπα θεωρούνται πιο ελκυστικά; Τι δείχνει νέα έρευνα

Τech & Science / Παράξενος «κροκόδειλος» χωρίς δόντια που μοιάζει με δεινόσαυρο ανακαλύφθηκε στο Νέο Μεξικό

Τech & Science / Μπορούν οι σταγόνες να διορθώσουν τη μυωπία; Η αυστηρή προειδοποίηση

Τech & Science / Γιατί μόνο το 2% των ανθρώπων έχει πράσινα μάτια – Η επιστήμη δίνει την απάντηση

Τech & Science / Γιατί πρέπει να έχουμε μαζί ένα μπαλάκι τένις όταν πετάμε με αεροπλάνο

Τech & Science / Γιατί η AI της Google δεν μπορεί να γράψει σωστά τη λέξη «Google» (ή οποιαδήποτε άλλη λέξη)

Τech & Science / Μελέτη: Ορισμένα κουνούπια φαίνεται να προσελκύονται από αντικουνουπικά

Τech & Science / Ο αυνανισμός στα πτηνά «είναι φυσιολογικός και δεν πρέπει να τιμωρείται», σύμφωνα με επιστήμονες

Τech & Science / Νέα έρευνα: Τα περιστέρια ίσως βρίσκουν τον δρόμο της επιστροφής χάρη στο συκώτι τους

Τech & Science / Η Google προειδοποιεί: Χάκερ χρησιμοποιούν AI για να εντοπίζουν αόρατα κενά ασφαλείας