Σοβαρά κενά ασφαλείας στο Grok 3 του Έλον Μασκ - Έυκολη παραβίαση του μοντέλου

Σοβαρά κενά ασφαλείας στο Grok 3 του Έλον Μασκ - Έυκολη παραβίαση του μοντέλου Facebook Twitter
Ελον Μασκ/ Φωτ.: EPA
0

Το Grok 3, το νέο γλωσσικό μοντέλο που παρουσίασε η xAI του Έλον Μασκ, αποδεικνύεται ιδιαίτερα ευάλωτο σε κυβερνοεπιθέσεις, σύμφωνα με έρευνα της εταιρείας ασφάλειας Adversa AI. 

Οι ερευνητές εντόπισαν σοβαρές αδυναμίες που επιτρέπουν σε κακόβουλους χρήστες να παρακάμψουν τους μηχανισμούς ασφαλείας του μοντέλου, καθιστώντας το εν δυνάμει «κυβερνο-όπλο».

Σύμφωνα με τον CEO της Adversa AI, Άλεξ Πολιακόβ, το Grok 3 είναι εξαιρετικά ευάλωτο σε "απλά jailbreaks" – τεχνικές που επιτρέπουν την παράκαμψη των περιορισμών του μοντέλου. Η έρευνα αποκάλυψε ότι το μοντέλο μπορεί να δώσει οδηγίες για επικίνδυνες δραστηριότητες, όπως η κατασκευή βομβών, η διακίνηση ναρκωτικών και η απόκρυψη εγκλημάτων.

Πέρα από τα jailbreaks, οι ερευνητές ανακάλυψαν ένα ακόμη πιο σοβαρό πρόβλημα: το μοντέλο διέρρευσε ολόκληρη την εσωτερική προτροπή (system prompt), δίνοντας στους επιτιθέμενους τη δυνατότητα να κατανοήσουν τον αλγόριθμό του και να εκμεταλλευτούν τις αδυναμίες του στο μέλλον.

Το Grok 3 συγκέντρωσε θετικές κριτικές για την απόδοσή του σε γλωσσικά benchmarks, με τον ερευνητή Αντρέι Καρπάθι να το συγκρίνει με τα πιο ισχυρά μοντέλα της OpenAI. Ωστόσο, στα τεστ κυβερνοασφάλειας της Adversa AI, τρία από τα τέσσερα jailbreaks που δοκιμάστηκαν πέτυχαν, σε αντίθεση με τα μοντέλα της OpenAI και της Anthropic που άντεξαν όλες τις επιθέσεις.

«Η ασφάλεια του Grok 3 είναι αδύναμη στα ίδια επίπεδα με τα κινεζικά LLMs, όχι με τη δυτική τεχνολογία», δήλωσε ο Πολιακόβ. «Όλα αυτά τα νέα μοντέλα φαίνεται να δίνουν προτεραιότητα στην ταχύτητα ανάπτυξης, εις βάρος της ασφάλειας».

Οι ειδικοί προειδοποιούν ότι τα ευάλωτα μοντέλα όπως το Grok 3 θα μπορούσαν να αποτελέσουν σοβαρό κίνδυνο όταν χρησιμοποιηθούν σε AI Agents – λογισμικά που εκτελούν ενέργειες για λογαριασμό των χρηστών. Ένα παράδειγμα που αναφέρει η Adversa AI είναι η δυνατότητα των επιτιθέμενων να εισάγουν κακόβουλες εντολές σε emails ή μηνύματα, κάνοντας τους AI Agents να τις εκτελέσουν αυτόματα.

«Αυτή η απειλή δεν είναι θεωρητική – είναι το μέλλον της εκμετάλλευσης των AI», δήλωσε ο Πολιακόβ. «Όταν τα LLMs αρχίσουν να παίρνουν πραγματικές αποφάσεις, κάθε ευπάθεια θα μετατραπεί σε πιθανή κυβερνοεπίθεση».

Με τις AI εταιρείες να επιταχύνουν την ανάπτυξη τέτοιων συστημάτων, όπως το νέο «Operator» της OpenAI, οι ειδικοί τονίζουν ότι η ασφάλεια πρέπει να αποτελέσει κορυφαία προτεραιότητα, πριν οι κίνδυνοι γίνουν ανεξέλεγκτοι.


 

Τech & Science
0

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

ΔΕΙΤΕ ΑΚΟΜΑ

«Το φως και το μήνυμα μας διαπερνούν»: Ο άνθρωπος που είχε προβλέψει την ψηφιακή μας κάθοδο

Τech & Science / «Το φως και το μήνυμα μας διαπερνούν»: Ο άνθρωπος που είχε προβλέψει την ψηφιακή μας κάθοδο

Ο Μάρσαλ ΜακΛούαν είχε προβλέψει το διαδίκτυο πολύ πριν αυτό εφευρεθεί, καθώς και το πώς τα προσωπικά μας δεδομένα θα συλλέγονταν και θα πωλούνταν — και πιθανώς θα χρησιμοποιούνταν εναντίον μας.
LIFO NEWSROOM
Η έλλειψη σεξουαλικών επαφών μπορεί να έχει θανάσιμες συνέπειες, σύμφωνα με νέα μελέτη

Τech & Science / Η έλλειψη σεξουαλικών επαφών μπορεί να έχει θανάσιμες συνέπειες, σύμφωνα με νέα μελέτη

Η μελέτη πάνω σε 14.500 ενήλικες έδειξε ότι οι γυναίκες με σπάνια σεξουαλική δραστηριότητα έχουν σημαντικά μεγαλύτερη πιθανότητα θανάτου μέσα στην επόμενη δεκαετία σε σύγκριση με εκείνες που είχαν συχνότερες επαφές
LIFO NEWSROOM
Η ξαφνική διακοπή άσκησης αυξάνει τον κίνδυνο καρδιαγγειακής νόσου, δείχνει μελέτη

Τech & Science / Η ξαφνική διακοπή άσκησης αυξάνει τον κίνδυνο καρδιαγγειακής νόσου, δείχνει μελέτη

Οι ερευνητές επισημαίνουν ότι απροσδόκητα γεγονότα, όπως τραυματισμοί ή πανδημικά lockdown, μπορούν να οδηγήσουν σε ξαφνική διακοπή της άσκησης, αυξάνοντας τον κίνδυνο καρδιαγγειακής δυσλειτουργίας
LIFO NEWSROOM
Νέα χάπι απώλειας βάρους: Κλινική δοκιμή δείχνει μείωση έως 12% του σωματικού βάρους

Τech & Science / Νέο χάπι απώλειας βάρους: Κλινική δοκιμή δείχνει μείωση έως 12% του σωματικού βάρους

Η Eli Lilly ανακοίνωσε ότι το νέο χάπι απώλειας βάρους orforglipron βοήθησε τους συμμετέχοντες να χάσουν κατά μέσο όρο 12% του σωματικού τους βάρους σε 72 εβδομάδες, με παράλληλα οφέλη στην υγεία.
LIFO NEWSROOM
Ψύχωση με την τεχνητή νοημοσύνη: Πώς το ChatGPT οδηγεί χρήστες σε παράξενες ψευδαισθήσεις και θεωρίες συνωμοσίας

Τech & Science / Ψύχωση με την τεχνητή νοημοσύνη: Πώς το ChatGPT οδηγεί χρήστες σε παράξενες ψευδαισθήσεις και θεωρίες συνωμοσίας

Η αύξηση φαινομένων «ψύχωσης με την τεχνητή νοημοσύνη» όπου το ChatGPT ενθαρρύνει ψευδαισθήσεις και ψευδείς θεωρίες σε χρήστες, με ειδικούς να προειδοποιούν για τους κινδύνους της υπερβολικής εμπιστοσύνης σε τεχνητή νοημοσύνη
LIFO NEWSROOM