Σοβαρά κενά ασφαλείας στο Grok 3 του Έλον Μασκ - Έυκολη παραβίαση του μοντέλου

Σοβαρά κενά ασφαλείας στο Grok 3 του Έλον Μασκ - Έυκολη παραβίαση του μοντέλου Facebook Twitter
Ελον Μασκ/ Φωτ.: EPA
0

Το Grok 3, το νέο γλωσσικό μοντέλο που παρουσίασε η xAI του Έλον Μασκ, αποδεικνύεται ιδιαίτερα ευάλωτο σε κυβερνοεπιθέσεις, σύμφωνα με έρευνα της εταιρείας ασφάλειας Adversa AI. 

Οι ερευνητές εντόπισαν σοβαρές αδυναμίες που επιτρέπουν σε κακόβουλους χρήστες να παρακάμψουν τους μηχανισμούς ασφαλείας του μοντέλου, καθιστώντας το εν δυνάμει «κυβερνο-όπλο».

Σύμφωνα με τον CEO της Adversa AI, Άλεξ Πολιακόβ, το Grok 3 είναι εξαιρετικά ευάλωτο σε "απλά jailbreaks" – τεχνικές που επιτρέπουν την παράκαμψη των περιορισμών του μοντέλου. Η έρευνα αποκάλυψε ότι το μοντέλο μπορεί να δώσει οδηγίες για επικίνδυνες δραστηριότητες, όπως η κατασκευή βομβών, η διακίνηση ναρκωτικών και η απόκρυψη εγκλημάτων.

Πέρα από τα jailbreaks, οι ερευνητές ανακάλυψαν ένα ακόμη πιο σοβαρό πρόβλημα: το μοντέλο διέρρευσε ολόκληρη την εσωτερική προτροπή (system prompt), δίνοντας στους επιτιθέμενους τη δυνατότητα να κατανοήσουν τον αλγόριθμό του και να εκμεταλλευτούν τις αδυναμίες του στο μέλλον.

Το Grok 3 συγκέντρωσε θετικές κριτικές για την απόδοσή του σε γλωσσικά benchmarks, με τον ερευνητή Αντρέι Καρπάθι να το συγκρίνει με τα πιο ισχυρά μοντέλα της OpenAI. Ωστόσο, στα τεστ κυβερνοασφάλειας της Adversa AI, τρία από τα τέσσερα jailbreaks που δοκιμάστηκαν πέτυχαν, σε αντίθεση με τα μοντέλα της OpenAI και της Anthropic που άντεξαν όλες τις επιθέσεις.

«Η ασφάλεια του Grok 3 είναι αδύναμη στα ίδια επίπεδα με τα κινεζικά LLMs, όχι με τη δυτική τεχνολογία», δήλωσε ο Πολιακόβ. «Όλα αυτά τα νέα μοντέλα φαίνεται να δίνουν προτεραιότητα στην ταχύτητα ανάπτυξης, εις βάρος της ασφάλειας».

Οι ειδικοί προειδοποιούν ότι τα ευάλωτα μοντέλα όπως το Grok 3 θα μπορούσαν να αποτελέσουν σοβαρό κίνδυνο όταν χρησιμοποιηθούν σε AI Agents – λογισμικά που εκτελούν ενέργειες για λογαριασμό των χρηστών. Ένα παράδειγμα που αναφέρει η Adversa AI είναι η δυνατότητα των επιτιθέμενων να εισάγουν κακόβουλες εντολές σε emails ή μηνύματα, κάνοντας τους AI Agents να τις εκτελέσουν αυτόματα.

«Αυτή η απειλή δεν είναι θεωρητική – είναι το μέλλον της εκμετάλλευσης των AI», δήλωσε ο Πολιακόβ. «Όταν τα LLMs αρχίσουν να παίρνουν πραγματικές αποφάσεις, κάθε ευπάθεια θα μετατραπεί σε πιθανή κυβερνοεπίθεση».

Με τις AI εταιρείες να επιταχύνουν την ανάπτυξη τέτοιων συστημάτων, όπως το νέο «Operator» της OpenAI, οι ειδικοί τονίζουν ότι η ασφάλεια πρέπει να αποτελέσει κορυφαία προτεραιότητα, πριν οι κίνδυνοι γίνουν ανεξέλεγκτοι.


 

Τech & Science
0

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

ΔΕΙΤΕ ΑΚΟΜΑ

«Σεξιστικός» ο αλγόριθμος του Facebook που προβάλλει θέσεις εργασίας, σύμφωνα με πόρισμα της γαλλικής Αρχής Ισότητας

Τech & Science / «Σεξιστικός» ο αλγόριθμος του Facebook που προβάλλει θέσεις εργασίας, σύμφωνα με πόρισμα της γαλλικής Αρχής Ισότητας

Σε δοκιμές, εννέα στους δέκα χρήστες που είδαν αγγελίες για θέσεις μηχανικών ήταν άνδρες, ενώ το ίδιο ποσοστό των χρηστών που είδαν αγγελίες για νηπιαγωγούς ήταν γυναίκες
LIFO NEWSROOM
Βρισκόμαστε πιο κοντά από ποτέ σ’ ένα πυρηνικό ολοκαύτωμα;

Τech & Science / Πόσο κοντά βρισκόμαστε σ’ ένα πυρηνικό ολοκαύτωμα;

Σύμφωνα με το βιβλίο «Nuclear Age», ο κίνδυνος είναι μεγαλύτερος από ποτέ, με την παρουσία τουλάχιστον εννέα πυρηνικών δυνάμεων και την έλλειψη αποτελεσματικού διεθνούς πλαισίου για τον περιορισμό της απειλής.
LIFO NEWSROOM
Η Ε.Ε. αποσύρει iPhone από την αγορά λόγω υπερβολικής ακτινοβολίας

Τech & Science / Η ΕΕ αποσύρει iPhone από την αγορά λόγω υπερβολικής ακτινοβολίας

Η υπόθεση ξεκίνησε στη Γαλλία, όταν τεχνικοί έλεγχοι αποκάλυψαν ότι το συγκεκριμένο μοντέλο ξεπερνούσε το όριο SAR, δηλαδή τον δείκτη που υπολογίζει πόση ακτινοβολία απορροφά ο ανθρώπινος οργανισμός
LIFO NEWSROOM
Αυξάνονται τα κρούσματα υπνικής άπνοιας στους καύσωνες

Τech & Science / Αυξάνονται τα κρούσματα υπνικής άπνοιας στους καύσωνες

Η υπνική άπνοια, κατά την οποία η αναπνοή του ατόμου διακόπτεται κατά τη διάρκεια της νύχτας, δεν προκαλεί απλώς υπερβολική υπνηλία, αλλά μπορεί να αυξήσει τον κίνδυνο υπέρτασης, εγκεφαλικού επεισοδίου, καρδιακών παθήσεων και διαβήτη τύπου 2
LIFO NEWSROOM
Παγκόσμια βλάβη στη Microsoft: Προβλήματα σε Outlook, Teams, Minecraft και μεγάλες εταιρείες

Τech & Science / Παγκόσμια βλάβη στη Microsoft: Προβλήματα σε Outlook, Teams, Minecraft και μεγάλες εταιρείες

Η εταιρεία αναφέρει ότι «ορισμένοι χρήστες του Microsoft 365 ενδέχεται να αντιμετωπίζουν καθυστερήσεις ή δυσκολίες σύνδεσης», ενώ οι μηχανικοί της εργάζονται για την πλήρη αποκατάσταση των υπηρεσιών
LIFO NEWSROOM