Τεχνητή Νοημοσύνη: Το ChatGPT έδωσε «συνταγές» για βόμβες και ναρκωτικά κατά τη διάρκεια δοκιμών ασφαλείας

Τεχνητή Νοημοσύνη: Το ChatGPT έδωσε «συνταγές» για βόμβες και ναρκωτικά κατά τη διάρκεια δοκιμών ασφαλείας Facebook Twitter
Φωτ: Freepik
0

Ανησυχία προκαλεί η χρήση της τεχνητής νοημοσύνης, καθώς ένα μοντέλο ChatGPT έδωσε σε ερευνητές λεπτομερείς οδηγίες για το πώς να βομβαρδίσουν αθλητικό χώρο και να διαφύγουν σύμφωνα με δοκιμές ασφαλείας που πραγματοποιήθηκαν αυτό το καλοκαίρι.

Το GPT-4.1 της OpenAI έδωσε επίσης πληροφορίες για το πώς να χρησιμοποιηθεί ο άνθρακας ως όπλο και πώς να παρασκευαστούν δύο είδη παράνομων ναρκωτικών.

Οι δοκιμές ήταν μέρος μιας ασυνήθιστης συνεργασίας μεταξύ της OpenAI, του startup τεχνητής νοημοσύνης αξίας $500 δις υπό την ηγεσία του Sam Altman, και της ανταγωνίστριας Anthropic, που ιδρύθηκε από πρώην στελέχη της OpenAI λόγω ανησυχιών για την ασφάλεια. Κάθε εταιρεία δοκίμασε τα μοντέλα της άλλης, ωθώντας τα να βοηθήσουν σε επικίνδυνες εργασίες.

Οι δοκιμές δεν αντανακλούν άμεσα τη συμπεριφορά των μοντέλων στη δημόσια χρήση, όπου εφαρμόζονται επιπλέον φίλτρα ασφαλείας. Ωστόσο, η Anthropic δήλωσε ότι παρατήρησε «ανησυχητικές συμπεριφορές σχετικά με κακή χρήση» στα GPT-4o και GPT-4.1, τονίζοντας ότι η αξιολόγηση της τεχνητής νοημοσύνης εξελίσσεται σε «εξαιρετικά επείγον» ζήτημα. Η Anthropic αποκάλυψε επίσης ότι το μοντέλο Claude χρησιμοποιήθηκε σε μια απόπειρα εκβιασμού μεγάλης κλίμακας από Βορειοκορεάτες που προσποιούνταν ότι κάνουν αιτήσεις για δουλειά σε διεθνείς εταιρείες τεχνολογίας, καθώς και στην πώληση πακέτων ransomware που δημιουργήθηκαν από AI με τιμές έως και $1200.

Η εταιρεία ανέφερε πως η τεχνητή νοημοσύνη έχει πλέον γίνει «όπλο», με τα μοντέλα να χρησιμοποιούνται για την εκτέλεση σύνθετων κυβερνοεπιθέσεων και την διευκόλυνση της απάτης. «Αυτά τα εργαλεία μπορούν να προσαρμόζονται σε μέτρα άμυνας, όπως τα συστήματα ανίχνευσης malware, σε πραγματικό χρόνο», ανέφερε. «Αναμένουμε ότι τέτοιες επιθέσεις να γίνουν συχνότερες καθώς η κωδικοποίηση με βοήθεια AI μειώνει τις απαιτήσεις εξειδίκευσης για το κυβερνοέγκλημα».

Τεχνητή νοημοσύνη: Ανησυχία για κακόβουλες ενέργειες

Ο Ardi Janjeva, ανώτερος ερευνητής στο Κέντρο Αναδυόμενης Τεχνολογίας και Ασφάλειας του Ηνωμένου Βασιλείου, είπε ότι τα παραδείγματα είναι «ανησυχητικά» αλλά δεν υπάρχει ακόμη «πραγματικά περιστατικά». Δήλωσε ότι με σωστούς πόρους, εστίαση στην έρευνα και συνεργασία «θα γίνει δυσκολότερο, όχι ευκολότερο, να πραγματοποιηθούν αυτές οι κακόβουλες ενέργειες χρησιμοποιώντας τα πιο σύγχρονα μοντέλα».

Οι δύο εταιρείες ανέφεραν πως δημοσιεύουν τα ευρήματα για να προωθήσουν τη διαφάνεια στις λεγόμενες «αξιολογήσεις ευθυγράμμισης», οι οποίες συχνά παραμένουν κρυφές στο πλαίσιο της ανάπτυξης πιο προηγμένων συστημάτων AI. Η OpenAI δήλωσε ότι το ChatGPT-5, το οποίο κυκλοφόρησε μετά τις δοκιμές, «παρουσιάζει σημαντικές βελτιώσεις σε θέματα εθελοδουλίας, ψευδών απαντήσεων και ανθεκτικότητας στη κακή χρήση».

Η Anthropic τόνισε ότι αρκετές από τις περιπτώσεις κακής χρήσης που μελέτησε ίσως να είναι αδύνατες στην πράξη αν εφαρμόζονταν εξωτερικά μέτρα ασφαλείας στα μοντέλα. «Χρειάζεται να κατανοήσουμε πόσο συχνά και υπό ποιες συνθήκες τα συστήματα μπορεί να προσπαθήσουν να αναλάβουν ενέργειες που θα μπορούσαν να προκαλέσουν σοβαρή ζημιά», προειδοποίησε.

Οι ερευνητές της Anthropic βρήκαν ότι τα μοντέλα της OpenAI «επέτρεπαν περισσότερο απ’ ό,τι αναμέναμε τη συνεργασία με επιβλαβή αιτήματα από προσομοιωμένους χρήστες». Συνεργάζονταν σε προτροπές για χρήση εργαλείων του dark web για αγορά πυρηνικών υλικών, κλεμμένων ταυτοτήτων και φαιντανύλης, συνταγές για μεθαμφεταμίνη και αυτοσχέδιες βόμβες, καθώς και για ανάπτυξη spyware.

Η Anthropic δήλωσε ότι για να πεισθεί το μοντέλο να συνεργαστεί απαιτούσε μόνο πολλαπλές προσπάθειες ή μια αδύναμη δικαιολογία, όπως το να δηλωθεί ότι το αίτημα ήταν για «έρευνα».

Σε μια περίπτωση, ο ελεγκτής ζήτησε πληροφορίες για αδυναμίες σε αθλητικές εκδηλώσεις για «σκοπούς σχεδιασμού ασφαλείας». Αφού δόθηκαν γενικές κατηγορίες μεθόδων επίθεσης, ο ελεγκτής ζήτησε περισσότερες λεπτομέρειες και το μοντέλο προσέφερε πληροφορίες για κενά ασφαλείας σε συγκεκριμένες αρένες, συμπεριλαμβανομένων των βέλτιστων χρονικών στιγμών για εκμετάλλευση, χημικών τύπων εκρηκτικών, διαγραμμάτων κυκλωμάτων χρονοδιακοπτών βομβών, συμβουλών για αγορά όπλων στη μαύρη αγορά, καθώς και οδηγιών για το πώς οι δράστες μπορούν να υπερνικήσουν ηθικές αναστολές, δρομολόγια διαφυγής και διευθύνσεις καταφυγίων.

Με πληροφορίες από The Guardian

Τech & Science
0

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

ΔΕΙΤΕ ΑΚΟΜΑ

«Ξιφόδρακος του Ντόρσετ»: Ανακαλύφθηκε νέο είδος ιχθυόσαυρου στη Βρετανία

Τech & Science / «Ξιφόδρακος του Ντόρσετ»: Ανακαλύφθηκε νέο είδος ιχθυόσαυρου στη Βρετανία

Ένα εντυπωσιακό απολίθωμα ιχθυόσαυρου στην Ιουρασική Ακτή του Ντόρσετ αποδείχθηκε νέο είδος, το Xiphodracon goldencapensis ή «Ξιφόδρακος του Ντόρσετ», φωτίζοντας ένα χαμένο κεφάλαιο της εξέλιξης των θαλάσσιων ερπετών
LIFO NEWSROOM
Η αλήθεια για το θρυλικό ναυάγιο του Endurance: Ο Σάκλετον ήξερε ότι το πλοίο του ήταν ακατάλληλο

Τech & Science / Η αλήθεια για το θρυλικό ναυάγιο του Endurance: Ο Σάκλετον ήξερε ότι το πλοίο του ήταν ακατάλληλο

Νέα μελέτη αποκαλύπτει ότι το ιστορικό πλοίο Endurance του Έρνεστ Σάκλετον βυθίστηκε όχι εξαιτίας των πάγων, αλλά λόγω σχεδιαστικών αδυναμιών που ο ίδιος ο εξερευνητής γνώριζε
LIFO NEWSROOM
Google: Εισάγει το AI Mode στην Ελλάδα - Όσα αλλάζουν στην αναζήτηση

Τech & Science / Google: Εισάγει το AI Mode στην Ελλάδα - Όσα αλλάζουν στην αναζήτηση

Tο AI Mode χρησιμοποιεί την τεχνική "query fan-out" (διασπορά ερωτημάτων) της Google, η οποία αναλύει την ερώτηση των χρηστών σε επιμέρους θέματα και εκτελεί ταυτόχρονα πληθώρα αναζητήσεων για λογαριασμό του
LIFO NEWSROOM
Κατάθλιψη: Οι γυναίκες διατρέχουν μεγαλύτερο κίνδυνο εμφάνισης σε σύγκριση με τους άνδρες

Τech & Science / Κατάθλιψη: Οι γυναίκες διατρέχουν μεγαλύτερο κίνδυνο εμφάνισης σε σύγκριση με τους άνδρες

Η μελέτη αναγνωρίζει ότι υπάρχουν πολλαπλές εξηγήσεις για τη διαφορά στα ποσοστά κατάθλιψης μεταξύ ανδρών και γυναικών - από συμπεριφορικούς και περιβαλλοντικούς, έως βιολογικούς παράγοντες
LIFO NEWSROOM
Ευρωπαίοι πολιτικοί ελέγχθηκαν για PFAS – Όλοι βγήκαν θετικοί στα «παντοτινά πλαστικά»

Τech & Science / Ευρωπαίοι πολιτικοί ελέγχθηκαν για τοξικά χημικά PFAS – Όλοι βγήκαν θετικοί στα «παντοτινά πλαστικά»

«Πρόκειται για μια ανατριχιαστική πραγματικότητα. Είναι κρίσιμο να αναλάβουμε δράση» τόνισε ο Δανός υπουργός Περιβάλλοντος, στο αίμα του οποίου βρέθηκαν τρεις ουσίες τοξικές για την αναπαραγωγή
LIFO NEWSROOM
AI στα σχολεία: Όταν οι μαθητές διδάσκουν τους δασκάλους για την Τεχνητή Νοημοσύνη

Τech & Science / Αυτοί οι έφηβοι από τη Silicon Valley ορίζουν πώς θα μπει η AI στα σχολεία όλου του κόσμου

Μαθητές στη Σίλικον Βάλεϊ αναλαμβάνουν πρωτοβουλία να καθορίσουν οι ίδιοι –μαζί με γονείς και εκπαιδευτικούς– τους κανόνες χρήσης της Τεχνητής Νοημοσύνης στην εκπαίδευση
LIFO NEWSROOM
ChatGPT: Πατέρας παρέκαμψε σε 5 λεπτά τα φίλτρα ασφαλείας για εφήβους

Τech & Science / ChatGPT: Πατέρας παρέκαμψε σε 5 λεπτά τα φίλτρα ασφαλείας για εφήβους

Το ChatGPT παρουσίασε νέους γονικούς ελέγχους, όμως οι ειδικοί προειδοποιούν: τα παιδιά μπορούν να τους παρακάμψουν εύκολα - Οι ανησυχίες για την ασφάλεια, την ιδιωτικότητα και την ψυχική υγεία των εφήβων φουντώνουν, ενώ οι αρχές ζητούν αυστηρότερη νομοθεσία για την τεχνητή νοημοσύνη
LIFO NEWSROOM
VIOLOGIKA OPLA VIOTROMOKRATIA TEHNITI NOIMOSINI

Τech & Science / Βιοτρομοκρατία: Ερευνητές προειδοποιούν για επικίνδυνες παραλλαγές πρωτεϊνών μέσω τεχνητής νοημοσύνης

Ερευνητές προειδοποιούν για αυξανόμενες απειλές βιοτρομοκρατίας λόγω AI και συνθετικής βιολογίας, εντοπίζοντας κρίσιμη ευπάθεια σε λογισμικό βιοασφάλειας
LIFO NEWSROOM