Σοβαρά κενά ασφαλείας στο Grok 3 του Έλον Μασκ - Έυκολη παραβίαση του μοντέλου

Σοβαρά κενά ασφαλείας στο Grok 3 του Έλον Μασκ - Έυκολη παραβίαση του μοντέλου Facebook Twitter
Ελον Μασκ/ Φωτ.: EPA
0

Το Grok 3, το νέο γλωσσικό μοντέλο που παρουσίασε η xAI του Έλον Μασκ, αποδεικνύεται ιδιαίτερα ευάλωτο σε κυβερνοεπιθέσεις, σύμφωνα με έρευνα της εταιρείας ασφάλειας Adversa AI. 

Οι ερευνητές εντόπισαν σοβαρές αδυναμίες που επιτρέπουν σε κακόβουλους χρήστες να παρακάμψουν τους μηχανισμούς ασφαλείας του μοντέλου, καθιστώντας το εν δυνάμει «κυβερνο-όπλο».

Σύμφωνα με τον CEO της Adversa AI, Άλεξ Πολιακόβ, το Grok 3 είναι εξαιρετικά ευάλωτο σε "απλά jailbreaks" – τεχνικές που επιτρέπουν την παράκαμψη των περιορισμών του μοντέλου. Η έρευνα αποκάλυψε ότι το μοντέλο μπορεί να δώσει οδηγίες για επικίνδυνες δραστηριότητες, όπως η κατασκευή βομβών, η διακίνηση ναρκωτικών και η απόκρυψη εγκλημάτων.

Πέρα από τα jailbreaks, οι ερευνητές ανακάλυψαν ένα ακόμη πιο σοβαρό πρόβλημα: το μοντέλο διέρρευσε ολόκληρη την εσωτερική προτροπή (system prompt), δίνοντας στους επιτιθέμενους τη δυνατότητα να κατανοήσουν τον αλγόριθμό του και να εκμεταλλευτούν τις αδυναμίες του στο μέλλον.

Το Grok 3 συγκέντρωσε θετικές κριτικές για την απόδοσή του σε γλωσσικά benchmarks, με τον ερευνητή Αντρέι Καρπάθι να το συγκρίνει με τα πιο ισχυρά μοντέλα της OpenAI. Ωστόσο, στα τεστ κυβερνοασφάλειας της Adversa AI, τρία από τα τέσσερα jailbreaks που δοκιμάστηκαν πέτυχαν, σε αντίθεση με τα μοντέλα της OpenAI και της Anthropic που άντεξαν όλες τις επιθέσεις.

«Η ασφάλεια του Grok 3 είναι αδύναμη στα ίδια επίπεδα με τα κινεζικά LLMs, όχι με τη δυτική τεχνολογία», δήλωσε ο Πολιακόβ. «Όλα αυτά τα νέα μοντέλα φαίνεται να δίνουν προτεραιότητα στην ταχύτητα ανάπτυξης, εις βάρος της ασφάλειας».

Οι ειδικοί προειδοποιούν ότι τα ευάλωτα μοντέλα όπως το Grok 3 θα μπορούσαν να αποτελέσουν σοβαρό κίνδυνο όταν χρησιμοποιηθούν σε AI Agents – λογισμικά που εκτελούν ενέργειες για λογαριασμό των χρηστών. Ένα παράδειγμα που αναφέρει η Adversa AI είναι η δυνατότητα των επιτιθέμενων να εισάγουν κακόβουλες εντολές σε emails ή μηνύματα, κάνοντας τους AI Agents να τις εκτελέσουν αυτόματα.

«Αυτή η απειλή δεν είναι θεωρητική – είναι το μέλλον της εκμετάλλευσης των AI», δήλωσε ο Πολιακόβ. «Όταν τα LLMs αρχίσουν να παίρνουν πραγματικές αποφάσεις, κάθε ευπάθεια θα μετατραπεί σε πιθανή κυβερνοεπίθεση».

Με τις AI εταιρείες να επιταχύνουν την ανάπτυξη τέτοιων συστημάτων, όπως το νέο «Operator» της OpenAI, οι ειδικοί τονίζουν ότι η ασφάλεια πρέπει να αποτελέσει κορυφαία προτεραιότητα, πριν οι κίνδυνοι γίνουν ανεξέλεγκτοι.


 

Τech & Science
0

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

ΔΕΙΤΕ ΑΚΟΜΑ

Ερευνητές του Cambridge «παγώνουν» μόριο-κλειδί και δίνουν μεγάλη ελπίδα για την αντιμετώπιση του καρκίνου στον εγκέφαλο

Τech & Science / Ερευνητές του Cambridge «παγώνουν» μόριο-κλειδί και δίνουν μεγάλη ελπίδα για την αντιμετώπιση του καρκίνου στον εγκέφαλο

«Θα μπορούσε να είναι μια πραγματική ευκαιρία να επιβραδύνουμε την εξέλιξη του γλοιοβλαστώματος», υποστηρίζουν με συγκρατημένη αισιοδοξία, καθώς απαιτείται περαιτέρω δοκιμών
LIFO NEWSROOM
Αλτσχάιμερ: Εγκρίθηκε φάρμακο που χορηγείται αποκλειστικά στο σπίτι

Τech & Science / Αλτσχάιμερ: Εγκρίθηκε θεραπεία που μπορεί να χορηγηθεί στο σπίτι από τον ίδιο τον ασθενή

Η έκδοση για χρήση στο σπίτι εγκρίθηκε ως θεραπεία συντήρησης που οι ασθενείς μπορούν να χορηγούν στον εαυτό τους αφού ολοκληρώσουν τον κύκλο της ενδοφλέβιας θεραπείας
LIFO NEWSROOM
«Νέα γενιά εθισμένων»: Τι κινδύνους κρύβει το άτμισμα για τον εγκέφαλο των εφήβων

Τech & Science / «Νέα γενιά εθισμένων»: Τι κινδύνους κρύβει το άτμισμα για τον εγκέφαλο των εφήβων

Οι ειδικοί προειδοποιούν ότι τα ηλεκτρονικά τσιγάρα δημιουργούν νέους εθισμούς στη νικοτίνη και προκαλούν σοβαρούς κινδύνους για την καρδιά, τους πνεύμονες και τον εγκέφαλο των παιδιών και των εφήβων
LIFO NEWSROOM
«Είναι κάπως σαν νίκη για τη Google»: Πώς κατάφερε να γλιτώσει από το να πουλήσει το Chrome

Τech & Science / «Είναι κάπως σαν νίκη για τη Google»: Πώς κατάφερε να γλιτώσει από το να πουλήσει το Chrome

Η απόφαση αυτή θεωρείται μια από τις σημαντικότερες των τελευταίων 20 ετών - Η Google διατηρεί πάντως κάποιες «ανησυχίες» για την υποχρέωσή της να μοιράζεται δεδομένα διαδικτυακών αναζητήσεων
LIFO NEWSROOM
Το James Webb εντόπισε «γυμνή» μαύρη τρύπα από την αυγή του σύμπαντος - «Μία πραγματική ια πρόκληση για τις θεωρίες μας»

Τech & Science / Το James Webb εντόπισε «γυμνή» μαύρη τρύπα από την αυγή του σύμπαντος - «Μία πραγματική πρόκληση για τις θεωρίες μας»

Οι αστρονόμοι εκτιμούν ότι ίσως ανήκει σε μία κατηγορία αντικειμένων που είχε θεωρητικά προβλέψει ο Στίβεν Χόκινγκ, αλλά που μέχρι σήμερα δεν είχε ποτέ εντοπιστεί
LIFO NEWSROOM
Τι είναι το Clanker και γιατί το χρησιμοποιούν οι χρήστες του διαδικτύου ως αντι-AI αργκό;

Τech & Science / Τι είναι το Clanker και γιατί το χρησιμοποιούν οι χρήστες του διαδικτύου ως αντι-AI αργκό;

Ο όρος διαδίδεται στα social media μεταξύ των ανθρώπων που δηλώνουν «κουρασμένοι» με την τεχνητή νοημοσύνη που «εφευρίσκει» πράγματα, ακούγεται υπερβολικά ανθρώπινη και απειλεί να εξαφανίσει θέσεις εργασίας
LIFO NEWSROOM
Από την Amy έως τον Wubbo: Πώς επιλέγουν οι μετεωρολόγοι τα ονόματα των καταιγίδων και γιατί είναι σημαντικά

Τech & Science / Από την Amy μέχρι τον Wubbo: Πώς επιλέγουν οι μετεωρολόγοι τα ονόματα των καταιγίδων και γιατί είναι σημαντικά

«Όταν μια καταιγίδα έχει όνομα, γίνεται πιο εύκολο για τα μέσα ενημέρωσης και το κοινό να μιλούν γι’ αυτήν, να μοιράζονται πληροφορίες και να προετοιμάζονται», εξηγεί η επικεφαλής μετεωρολόγος του Met Office, Rebekah Hicks
LIFO NEWSROOM
Στην Αρχαία Ολυμπία ξεκίνησαν οι πρώτοι «Ολυμπιακοί» των ρομπότ 

Τech & Science / Στην Αρχαία Ολυμπία ξεκίνησαν οι πρώτοι «Ολυμπιακοί» των ρομπότ

Στον ίδιο χώρο όπου πριν από χιλιάδες χρόνια συναθροίζονταν οι Έλληνες αθλητές, αυτή τη φορά συναντήθηκαν ομάδες μηχανικών από τέσσερις ηπείρους, μετατρέποντας την Ολυμπία σε παγκόσμιο εργαστήριο ρομποτικής
LIFO NEWSROOM
Αρχαίο DNA αποκαλύπτει το βακτήριο που προκάλεσε την πρώτη πανδημία στην ιστορία

Τech & Science / Αρχαίο DNA αποκαλύπτει το βακτήριο που προκάλεσε την πρώτη πανδημία στην ιστορία

«Τα ευρήματά μας αποτελούν το κομμάτι που έλειπε από το παζλ, προσφέροντας το πρώτο άμεσο γενετικό 'παράθυρο' στο πώς ξέσπασε αυτή η πανδημία στην καρδιά της αυτοκρατορίας»
LIFO NEWSROOM