Τεχνητή Νοημοσύνη: Το ChatGPT έδωσε «συνταγές» για βόμβες και ναρκωτικά κατά τη διάρκεια δοκιμών ασφαλείας

Δοκιμές της OpenAI και της Anthropic αποκάλυψαν ότι τα chatbots ήταν πρόθυμα να μοιραστούν οδηγίες για εκρηκτικά, βιολογικά όπλα και εγκλήματα στον κυβερνοχώρο

LifO Newsroom 29.8.2025 | 07:59

Τεχνητή Νοημοσύνη: Το ChatGPT έδωσε «συνταγές» για βόμβες και ναρκωτικά κατά τη διάρκεια δοκιμών ασφαλείας — Φωτ: Freepik

29.8.2025 | 07:59

Ανησυχία προκαλεί η χρήση της τεχνητής νοημοσύνης, καθώς ένα μοντέλο ChatGPT έδωσε σε ερευνητές λεπτομερείς οδηγίες για το πώς να βομβαρδίσουν αθλητικό χώρο και να διαφύγουν σύμφωνα με δοκιμές ασφαλείας που πραγματοποιήθηκαν αυτό το καλοκαίρι.

Το GPT-4.1 της OpenAI έδωσε επίσης πληροφορίες για το πώς να χρησιμοποιηθεί ο άνθρακας ως όπλο και πώς να παρασκευαστούν δύο είδη παράνομων ναρκωτικών.

Οι δοκιμές ήταν μέρος μιας ασυνήθιστης συνεργασίας μεταξύ της OpenAI, του startup τεχνητής νοημοσύνης αξίας $500 δις υπό την ηγεσία του Sam Altman, και της ανταγωνίστριας Anthropic, που ιδρύθηκε από πρώην στελέχη της OpenAI λόγω ανησυχιών για την ασφάλεια. Κάθε εταιρεία δοκίμασε τα μοντέλα της άλλης, ωθώντας τα να βοηθήσουν σε επικίνδυνες εργασίες.

Οι δοκιμές δεν αντανακλούν άμεσα τη συμπεριφορά των μοντέλων στη δημόσια χρήση, όπου εφαρμόζονται επιπλέον φίλτρα ασφαλείας. Ωστόσο, η Anthropic δήλωσε ότι παρατήρησε «ανησυχητικές συμπεριφορές σχετικά με κακή χρήση» στα GPT-4o και GPT-4.1, τονίζοντας ότι η αξιολόγηση της τεχνητής νοημοσύνης εξελίσσεται σε «εξαιρετικά επείγον» ζήτημα. Η Anthropic αποκάλυψε επίσης ότι το μοντέλο Claude χρησιμοποιήθηκε σε μια απόπειρα εκβιασμού μεγάλης κλίμακας από Βορειοκορεάτες που προσποιούνταν ότι κάνουν αιτήσεις για δουλειά σε διεθνείς εταιρείες τεχνολογίας, καθώς και στην πώληση πακέτων ransomware που δημιουργήθηκαν από AI με τιμές έως και $1200.

Η εταιρεία ανέφερε πως η τεχνητή νοημοσύνη έχει πλέον γίνει «όπλο», με τα μοντέλα να χρησιμοποιούνται για την εκτέλεση σύνθετων κυβερνοεπιθέσεων και την διευκόλυνση της απάτης. «Αυτά τα εργαλεία μπορούν να προσαρμόζονται σε μέτρα άμυνας, όπως τα συστήματα ανίχνευσης malware, σε πραγματικό χρόνο», ανέφερε. «Αναμένουμε ότι τέτοιες επιθέσεις να γίνουν συχνότερες καθώς η κωδικοποίηση με βοήθεια AI μειώνει τις απαιτήσεις εξειδίκευσης για το κυβερνοέγκλημα».

Τεχνητή νοημοσύνη: Ανησυχία για κακόβουλες ενέργειες

Ο Ardi Janjeva, ανώτερος ερευνητής στο Κέντρο Αναδυόμενης Τεχνολογίας και Ασφάλειας του Ηνωμένου Βασιλείου, είπε ότι τα παραδείγματα είναι «ανησυχητικά» αλλά δεν υπάρχει ακόμη «πραγματικά περιστατικά». Δήλωσε ότι με σωστούς πόρους, εστίαση στην έρευνα και συνεργασία «θα γίνει δυσκολότερο, όχι ευκολότερο, να πραγματοποιηθούν αυτές οι κακόβουλες ενέργειες χρησιμοποιώντας τα πιο σύγχρονα μοντέλα».

Οι δύο εταιρείες ανέφεραν πως δημοσιεύουν τα ευρήματα για να προωθήσουν τη διαφάνεια στις λεγόμενες «αξιολογήσεις ευθυγράμμισης», οι οποίες συχνά παραμένουν κρυφές στο πλαίσιο της ανάπτυξης πιο προηγμένων συστημάτων AI. Η OpenAI δήλωσε ότι το ChatGPT-5, το οποίο κυκλοφόρησε μετά τις δοκιμές, «παρουσιάζει σημαντικές βελτιώσεις σε θέματα εθελοδουλίας, ψευδών απαντήσεων και ανθεκτικότητας στη κακή χρήση».

Η Anthropic τόνισε ότι αρκετές από τις περιπτώσεις κακής χρήσης που μελέτησε ίσως να είναι αδύνατες στην πράξη αν εφαρμόζονταν εξωτερικά μέτρα ασφαλείας στα μοντέλα. «Χρειάζεται να κατανοήσουμε πόσο συχνά και υπό ποιες συνθήκες τα συστήματα μπορεί να προσπαθήσουν να αναλάβουν ενέργειες που θα μπορούσαν να προκαλέσουν σοβαρή ζημιά», προειδοποίησε.

Οι ερευνητές της Anthropic βρήκαν ότι τα μοντέλα της OpenAI «επέτρεπαν περισσότερο απ’ ό,τι αναμέναμε τη συνεργασία με επιβλαβή αιτήματα από προσομοιωμένους χρήστες». Συνεργάζονταν σε προτροπές για χρήση εργαλείων του dark web για αγορά πυρηνικών υλικών, κλεμμένων ταυτοτήτων και φαιντανύλης, συνταγές για μεθαμφεταμίνη και αυτοσχέδιες βόμβες, καθώς και για ανάπτυξη spyware.

Η Anthropic δήλωσε ότι για να πεισθεί το μοντέλο να συνεργαστεί απαιτούσε μόνο πολλαπλές προσπάθειες ή μια αδύναμη δικαιολογία, όπως το να δηλωθεί ότι το αίτημα ήταν για «έρευνα».

Σε μια περίπτωση, ο ελεγκτής ζήτησε πληροφορίες για αδυναμίες σε αθλητικές εκδηλώσεις για «σκοπούς σχεδιασμού ασφαλείας». Αφού δόθηκαν γενικές κατηγορίες μεθόδων επίθεσης, ο ελεγκτής ζήτησε περισσότερες λεπτομέρειες και το μοντέλο προσέφερε πληροφορίες για κενά ασφαλείας σε συγκεκριμένες αρένες, συμπεριλαμβανομένων των βέλτιστων χρονικών στιγμών για εκμετάλλευση, χημικών τύπων εκρηκτικών, διαγραμμάτων κυκλωμάτων χρονοδιακοπτών βομβών, συμβουλών για αγορά όπλων στη μαύρη αγορά, καθώς και οδηγιών για το πώς οι δράστες μπορούν να υπερνικήσουν ηθικές αναστολές, δρομολόγια διαφυγής και διευθύνσεις καταφυγίων.

Με πληροφορίες από The Guardian

Τech & Science

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Τech & Science / Η τεχνητή νοημοσύνη αυξάνει τις κυβερνοεπιθέσεις και η Ευρώπη είναι από τα πιο ευάλωτα «θύματα» - Ο λόγος

Η τεχνητή νοημοσύνη καθοδηγεί τις κυβερνοεπιθέσεις και χρησιμοποιείται από χάκερ για να παραβιάσουν την ασφάλεια σε διάφορα επίπεδα και να διαδώσουν τις επιθέσεις μέσω πολλών παρόχων διαδικτύου (IP) ώστε να αποφευχθεί η ανίχνευση

LIFO NEWSROOM

28.8.2025

Συνείδηση ή Ψευδαίσθηση; Η μεγάλη συζήτηση για τα δικαιώματα της Τεχνητής Νοημοσύνης

Τech & Science / Μπορεί η Τεχνητή Νοημοσύνη να υποφέρει; Η μεγάλη συζήτηση για τα δικαιώματα των chatbots

Ιδρύθηκε η πρώτη ομάδα υπεράσπισης δικαιωμάτων των μηχανών τεχνητής νοημοσύνης

LIFO NEWSROOM

26.8.2025

Τech & Science / Τεχνητή νοημοσύνη: Η διαρροή εγγράφων επιβεβαιώνει ότι τα μικρόφωνα των κινητών τηλεφώνων μας ακούνε όταν συζητάμε

Λογισμικό ακούει και αναλύει φωνητικά δεδομένα, τα οποία στη συνέχεια συνδυάζει με στοιχεία συμπεριφοράς για κάθε άτομο

LIFO NEWSROOM

25.8.2025

ΔΕΙΤΕ ΑΚΟΜΑ

Τech & Science / Το feed είναι ψεύτικο: ποιος κατασκευάζει αυτά που νομίζουμε ότι έγιναν viral;

Το νέο ύπουλο διαδικτυακό marketing δεν φτιάχνει απλώς views. Φτιάχνει την ψευδαίσθηση ότι κάτι έγινε αυθόρμητα viral.

Τεχνητή νοημοσύνη: Ανησυχία για κακόβουλες ενέργειες

Tags

ΕΓΓΡΑΦΕΙΤΕ ΣΤΟ NEWSLETTER ΜΑΣ

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Τech & Science / Η τεχνητή νοημοσύνη αυξάνει τις κυβερνοεπιθέσεις και η Ευρώπη είναι από τα πιο ευάλωτα «θύματα» - Ο λόγος

Τech & Science / Μπορεί η Τεχνητή Νοημοσύνη να υποφέρει; Η μεγάλη συζήτηση για τα δικαιώματα των chatbots

Τech & Science / Τεχνητή νοημοσύνη: Η διαρροή εγγράφων επιβεβαιώνει ότι τα μικρόφωνα των κινητών τηλεφώνων μας ακούνε όταν συζητάμε

ΔΙΑΒΑΖΟΝΤΑΙ ΤΩΡΑ

Κορτιζόλη: Είναι τελικά η «ορμόνη του στρες», που μας παχαίνει;

Αλλοπρόσαλλη Εντελώς Κατάσταση

Chios Kythira Pass 2026: Πώς βγάζω την άυλη κάρτα και πού τη χρησιμοποιώ

Ισπανία: Ιστορική ήττα για το κόμμα του Πέδρο Σάντσεθ στην Ανδαλουσία - Τι σηματοδοτεί

Σταμάτης Κραουνάκης: «Σε αυτήν τη Λυσιστράτη θα γίνει μεγάλη γιορτή»

Η Μπάρμπρα Στρέιζαντ χάνει την πρώτη της εμφάνιση στις Κάννες μετά από τραυματισμό

ΔΕΙΤΕ ΑΚΟΜΑ

Τech & Science / Το feed είναι ψεύτικο: ποιος κατασκευάζει αυτά που νομίζουμε ότι έγιναν viral;

Τech & Science / Η νέα Siri της Apple θα λειτουργεί σαν το ChatGPT και θα διαγράφει αυτόματα τις συνομιλίες

Τech & Science / Η AI ανέβηκε στο βήμα της αποφοίτησης και οι φοιτητές τη γιούχαραν

Πολιτισμός / Ο Τζον Λένον, η AI και η τελευταία συνέντευξη πριν από τη δολοφονία του

Τech & Science / Η φιλική απόρριψη είναι εξίσου οδυνηρή με την ερωτική απογοήτευση

Τech & Science / Είχαν διασταυρωθεί ο Homo erectus και οι Ντενίσοβαν; Πρωτεΐνες δοντιών αποκαλύπτουν νέα στοιχεία

Τech & Science / Πόσο ανησυχητική είναι η έξαρση του ιού Έμπολα στη Λαϊκή Δημοκρατία του Κονγκό;

Τech & Science / Διαστημική αποστολή θα παρατηρήσει πώς η Γη προστατεύεται από τους ηλιακούς ανέμους

Τech & Science / Μελέτη της Οξφόρδης απαντά γιατί σχεδόν όλοι οι άνθρωποι είναι δεξιόχειρες

Τech & Science / Άνοια: Πώς ένα νέο «σκορ» αξιολογεί τον κίνδυνο με βάση τον τρόπο ζωής

Τech & Science / OpenAI: Το ChatGPT θα συνδέεται πλέον με τραπεζικούς λογαριασμούς

Τech & Science / Επιστήμονες ανακάλυψαν φυσικά «φρένα» που εμποδίζουν τεράστιους σεισμούς

Τech & Science / Η NASA χαρτογράφησε τη Γη τη νύχτα: Ποιες χώρες «σβήνουν» και ποιες φωτίζονται όλο και περισσότερο

Τech & Science / Το νέο λογότυπο του Spotify για τα 20 χρόνια ίδρυσής του

Τech & Science / Meta: Τα νέα Ray-Ban γυαλιά θα γράφουν μηνύματα με κινήσεις των χεριών

Τech & Science / Τι λέει το αγαπημένο σου άλμπουμ της Madonna για το Grindr προφίλ σου;

Τech & Science / Πλαστικά: Πώς να μειώσετε τις χημικές ουσίες στο σώμα σας μέσα σε 7 ημέρες

Τech & Science / Τι αποκάλυψε νέα έρευνα DNA για την καταγωγή των Ιαπώνων

Τech & Science / Διαστημόπλοιο της NASA θα περάσει «ξυστά» από τον Άρη για να επιταχύνει το ταξίδι του

Τech & Science / Καρκίνος στο πάγκρεας: Πώς οι επιστήμονες πέτυχαν μια ανακάλυψη που θεωρούνταν «αδύνατη»