Σοβαρά κενά ασφαλείας στο Grok 3 του Έλον Μασκ - Έυκολη παραβίαση του μοντέλου

Σοβαρά κενά ασφαλείας στο Grok 3 του Έλον Μασκ - Έυκολη παραβίαση του μοντέλου Facebook Twitter
Ελον Μασκ/ Φωτ.: EPA
0

Το Grok 3, το νέο γλωσσικό μοντέλο που παρουσίασε η xAI του Έλον Μασκ, αποδεικνύεται ιδιαίτερα ευάλωτο σε κυβερνοεπιθέσεις, σύμφωνα με έρευνα της εταιρείας ασφάλειας Adversa AI. 

Οι ερευνητές εντόπισαν σοβαρές αδυναμίες που επιτρέπουν σε κακόβουλους χρήστες να παρακάμψουν τους μηχανισμούς ασφαλείας του μοντέλου, καθιστώντας το εν δυνάμει «κυβερνο-όπλο».

Σύμφωνα με τον CEO της Adversa AI, Άλεξ Πολιακόβ, το Grok 3 είναι εξαιρετικά ευάλωτο σε "απλά jailbreaks" – τεχνικές που επιτρέπουν την παράκαμψη των περιορισμών του μοντέλου. Η έρευνα αποκάλυψε ότι το μοντέλο μπορεί να δώσει οδηγίες για επικίνδυνες δραστηριότητες, όπως η κατασκευή βομβών, η διακίνηση ναρκωτικών και η απόκρυψη εγκλημάτων.

Πέρα από τα jailbreaks, οι ερευνητές ανακάλυψαν ένα ακόμη πιο σοβαρό πρόβλημα: το μοντέλο διέρρευσε ολόκληρη την εσωτερική προτροπή (system prompt), δίνοντας στους επιτιθέμενους τη δυνατότητα να κατανοήσουν τον αλγόριθμό του και να εκμεταλλευτούν τις αδυναμίες του στο μέλλον.

Το Grok 3 συγκέντρωσε θετικές κριτικές για την απόδοσή του σε γλωσσικά benchmarks, με τον ερευνητή Αντρέι Καρπάθι να το συγκρίνει με τα πιο ισχυρά μοντέλα της OpenAI. Ωστόσο, στα τεστ κυβερνοασφάλειας της Adversa AI, τρία από τα τέσσερα jailbreaks που δοκιμάστηκαν πέτυχαν, σε αντίθεση με τα μοντέλα της OpenAI και της Anthropic που άντεξαν όλες τις επιθέσεις.

«Η ασφάλεια του Grok 3 είναι αδύναμη στα ίδια επίπεδα με τα κινεζικά LLMs, όχι με τη δυτική τεχνολογία», δήλωσε ο Πολιακόβ. «Όλα αυτά τα νέα μοντέλα φαίνεται να δίνουν προτεραιότητα στην ταχύτητα ανάπτυξης, εις βάρος της ασφάλειας».

Οι ειδικοί προειδοποιούν ότι τα ευάλωτα μοντέλα όπως το Grok 3 θα μπορούσαν να αποτελέσουν σοβαρό κίνδυνο όταν χρησιμοποιηθούν σε AI Agents – λογισμικά που εκτελούν ενέργειες για λογαριασμό των χρηστών. Ένα παράδειγμα που αναφέρει η Adversa AI είναι η δυνατότητα των επιτιθέμενων να εισάγουν κακόβουλες εντολές σε emails ή μηνύματα, κάνοντας τους AI Agents να τις εκτελέσουν αυτόματα.

«Αυτή η απειλή δεν είναι θεωρητική – είναι το μέλλον της εκμετάλλευσης των AI», δήλωσε ο Πολιακόβ. «Όταν τα LLMs αρχίσουν να παίρνουν πραγματικές αποφάσεις, κάθε ευπάθεια θα μετατραπεί σε πιθανή κυβερνοεπίθεση».

Με τις AI εταιρείες να επιταχύνουν την ανάπτυξη τέτοιων συστημάτων, όπως το νέο «Operator» της OpenAI, οι ειδικοί τονίζουν ότι η ασφάλεια πρέπει να αποτελέσει κορυφαία προτεραιότητα, πριν οι κίνδυνοι γίνουν ανεξέλεγκτοι.


 

Τech & Science
0

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

ΔΕΙΤΕ ΑΚΟΜΑ

PFAS ΠΑΝΤΟΤΙΝΑ ΧΗΜΙΚΑ ΠΑΙΔΙΑ ΛΕΥΧΑΙΜΙΑ

Τech & Science / Η πρώιμη έκθεση των παιδιών στα «παντοτινά χημικά» συνδέεται με κίνδυνο εμφάνισης λευχαιμίας

Tα «παντοτινά χημικά» βρίσκονται μεταξύ άλλων σε πόσιμο νερό, δοχεία τροφίμων και ποτών, αντικολλητικά μαγειρικά σκεύη και υφάσματα ανθεκτικά στους λεκέδες
THE LIFO TEAM
Η Canva ζήτησε συγγνώμη επειδή AI εργαλείο της άλλαζε τη λέξη «Palestine» σε «Ukraine»

Τech & Science / Η Canva ζήτησε συγγνώμη επειδή AI εργαλείο της άλλαζε τη λέξη «Palestine» σε «Ukraine»

Το Magic Layers, νέο εργαλείο τεχνητής νοημοσύνης της Canva, φέρεται να αντικαθιστούσε τη λέξη «Palestine» με «Ukraine» σε σχέδια χρηστών. Η εταιρεία είπε ότι διόρθωσε το πρόβλημα και προσθέτει νέους ελέγχους για να μην επαναληφθεί.
THE LIFO TEAM
ΔΕΠΥ ΠΑΙΔΙΑ

Τech & Science / ΔΕΠΥ: Εργαλείο τεχνητής νοημοσύνης θα μπορούσε να βοηθήσει στην έγκαιρη διάγνωση στα παιδιά

Οι ερευνητές διαπίστωσαν ότι το σύστημα τεχνητής νοημοσύνης μπορούσε να εντοπίζει με ακρίβεια πρώιμα προειδοποιητικά σημάδια της Διαταραχής Ελλειμματικής Προσοχής και Υπερκινητικότητας, γεγονός που θα μπορούσε να επιτρέψει στα παιδιά να λάβουν την απαραίτητη υποστήριξη πολύ νωρίτερα
THE LIFO TEAM
Η Τέιλορ Σουίφτ θέλει να κατοχυρώσει τη φωνή της πριν την αντιγράψει η τεχνητή νοημοσύνη

Τech & Science / Η Τέιλορ Σουίφτ θέλει να κατοχυρώσει τη φωνή της πριν την αντιγράψει η τεχνητή νοημοσύνη

Η Τέιλορ Σουίφτ κατέθεσε αιτήσεις για την κατοχύρωση δύο ηχητικών αποσπασμάτων της φωνής της και μίας φωτογραφίας της από τη σκηνή, σε μια κίνηση που συνδέεται με την ανησυχία για AI deepfakes, ψεύτικες διαφημίσεις και μη εξουσιοδοτημένες χρήσεις της εικόνας της.
THE LIFO TEAM
Οι influencers αντικαθιστούν τον εαυτό τους με AI κλώνους

Τech & Science / Οι influencers αντικαθιστούν τον εαυτό τους με AI κλώνους

Από τον Κάμπι Λέιμ μέχρι τον Άντι Κόεν, τα AI «ψηφιακά δίδυμα» δημιουργών και celebrities γίνονται το νέο προϊόν για brands, πλατφόρμες και talent agencies. Η υπόσχεση είναι λιγότερο burnout και περισσότερες εμπορικές ευκαιρίες. Ο κίνδυνος, όμως, είναι πολύ μεγαλύτερος: οι creators να χάσουν τον έλεγχο της ίδιας τους της εικόνας.
THE LIFO TEAM
Σχεδόν τα μισά τραγούδια που ανεβαίνουν καθημερινά στο Deezer είναι φτιαγμένα από AI

Τech & Science / Σχεδόν τα μισά τραγούδια που ανεβαίνουν καθημερινά στο Deezer είναι φτιαγμένα από AI

Η τεχνητή νοημοσύνη υπογράφει πλέον το 44% των νέων uploads στο Deezer, όμως πίσω από τα 75.000 καθημερινά tracks κρύβεται ένα παράδοξο: η πραγματική ακροαματικότητα παραμένει οριακή, ενώ τα περισσότερα streams αποδεικνύονται πλασματικά, αφήνοντας τους δημιουργούς χωρίς έσοδα.
THE LIFO TEAM
ΔΙΑΣΤΗΜΑ ΣΕΛΗΝΗ ΚΙΝΑ ΗΠΑ

Τech & Science / «Η χελώνα και ο λαγός»: θα νικήσει η Κίνα τις ΗΠΑ στον «αγώνα» επιστροφής στη Σελήνη;

Οι αντίπαλες υπερδυνάμεις εντείνουν τις προετοιμασίες για μια επανδρωμένη προσγείωση στη Σελήνη, σχεδόν έξι δεκαετίες μετά το πρώτο βήμα στον φυσικο δορυφόρο της Γης
THE LIFO TEAM