Σοβαρά κενά ασφαλείας στο Grok 3 του Έλον Μασκ - Έυκολη παραβίαση του μοντέλου

Η έρευνα αποκάλυψε ότι το μοντέλο μπορεί να δώσει οδηγίες για επικίνδυνες δραστηριότητες, όπως η κατασκευή βομβών, η διακίνηση ναρκωτικών και η απόκρυψη εγκλημάτων

LifO Newsroom 20.2.2025 | 09:12

Σοβαρά κενά ασφαλείας στο Grok 3 του Έλον Μασκ - Έυκολη παραβίαση του μοντέλου — Ελον Μασκ/ Φωτ.: EPA

20.2.2025 | 09:12

Το Grok 3, το νέο γλωσσικό μοντέλο που παρουσίασε η xAI του Έλον Μασκ, αποδεικνύεται ιδιαίτερα ευάλωτο σε κυβερνοεπιθέσεις, σύμφωνα με έρευνα της εταιρείας ασφάλειας Adversa AI.

Οι ερευνητές εντόπισαν σοβαρές αδυναμίες που επιτρέπουν σε κακόβουλους χρήστες να παρακάμψουν τους μηχανισμούς ασφαλείας του μοντέλου, καθιστώντας το εν δυνάμει «κυβερνο-όπλο».

Σύμφωνα με τον CEO της Adversa AI, Άλεξ Πολιακόβ, το Grok 3 είναι εξαιρετικά ευάλωτο σε "απλά jailbreaks" – τεχνικές που επιτρέπουν την παράκαμψη των περιορισμών του μοντέλου. Η έρευνα αποκάλυψε ότι το μοντέλο μπορεί να δώσει οδηγίες για επικίνδυνες δραστηριότητες, όπως η κατασκευή βομβών, η διακίνηση ναρκωτικών και η απόκρυψη εγκλημάτων.

Πέρα από τα jailbreaks, οι ερευνητές ανακάλυψαν ένα ακόμη πιο σοβαρό πρόβλημα: το μοντέλο διέρρευσε ολόκληρη την εσωτερική προτροπή (system prompt), δίνοντας στους επιτιθέμενους τη δυνατότητα να κατανοήσουν τον αλγόριθμό του και να εκμεταλλευτούν τις αδυναμίες του στο μέλλον.

Το Grok 3 συγκέντρωσε θετικές κριτικές για την απόδοσή του σε γλωσσικά benchmarks, με τον ερευνητή Αντρέι Καρπάθι να το συγκρίνει με τα πιο ισχυρά μοντέλα της OpenAI. Ωστόσο, στα τεστ κυβερνοασφάλειας της Adversa AI, τρία από τα τέσσερα jailbreaks που δοκιμάστηκαν πέτυχαν, σε αντίθεση με τα μοντέλα της OpenAI και της Anthropic που άντεξαν όλες τις επιθέσεις.

«Η ασφάλεια του Grok 3 είναι αδύναμη στα ίδια επίπεδα με τα κινεζικά LLMs, όχι με τη δυτική τεχνολογία», δήλωσε ο Πολιακόβ. «Όλα αυτά τα νέα μοντέλα φαίνεται να δίνουν προτεραιότητα στην ταχύτητα ανάπτυξης, εις βάρος της ασφάλειας».

Οι ειδικοί προειδοποιούν ότι τα ευάλωτα μοντέλα όπως το Grok 3 θα μπορούσαν να αποτελέσουν σοβαρό κίνδυνο όταν χρησιμοποιηθούν σε AI Agents – λογισμικά που εκτελούν ενέργειες για λογαριασμό των χρηστών. Ένα παράδειγμα που αναφέρει η Adversa AI είναι η δυνατότητα των επιτιθέμενων να εισάγουν κακόβουλες εντολές σε emails ή μηνύματα, κάνοντας τους AI Agents να τις εκτελέσουν αυτόματα.

«Αυτή η απειλή δεν είναι θεωρητική – είναι το μέλλον της εκμετάλλευσης των AI», δήλωσε ο Πολιακόβ. «Όταν τα LLMs αρχίσουν να παίρνουν πραγματικές αποφάσεις, κάθε ευπάθεια θα μετατραπεί σε πιθανή κυβερνοεπίθεση».

Με τις AI εταιρείες να επιταχύνουν την ανάπτυξη τέτοιων συστημάτων, όπως το νέο «Operator» της OpenAI, οι ειδικοί τονίζουν ότι η ασφάλεια πρέπει να αποτελέσει κορυφαία προτεραιότητα, πριν οι κίνδυνοι γίνουν ανεξέλεγκτοι.

Τech & Science

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Διεθνή / Τραμπ: Εκτελεστικό διάταγμα για τον τερματισμό των ομοσπονδιακών παροχών σε παράτυπους μετανάστες

Την ίδια ημέρα, ο Τραμπ υπέγραψε διάταγμα που απαιτεί από όλα τα υπουργεία να επανεξετάσουν τους κανονισμούς τους, σε συνεργασία με την ομάδα του Έλον Μασκ για την «αποτελεσματικότητα της κυβέρνησης»

LIFO NEWSROOM

20.2.2025

Τραμπ και Μασκ αντάλλαξαν λόγια αγάπης στη κοινή συνέντευξή τους στο Fox

Διεθνή / Τραμπ και Μασκ αντάλλαξαν λόγια αγάπης στη κοινή συνέντευξή τους: «Προσπαθούν να μας χωρίσουν»

Οι δύο άνδρες μίλησαν με εξαιρετικά κολακευτικά λόγια ο ένας για τον άλλον, απορρίπτοντας τις κατηγορίες ότι ο Μασκ σφετερίζεται την εξουσία του προέδρου

LIFO NEWSROOM

19.2.2025

ΔΕΙΤΕ ΑΚΟΜΑ

Ο Πάπας ετοιμάζει την πρώτη μεγάλη εγκύκλιο για την AI και τη βλέπει ως νέα Βιομηχανική Επανάσταση

Διεθνή / Ο Πάπας ετοιμάζει την πρώτη μεγάλη εγκύκλιο για την AI και τη βλέπει ως τη νέα Βιομηχανική Επανάσταση

Στην πρώτη μεγάλη εγκύκλιο της παποσύνης του, ο Λέων ΙΔ΄ βάζει την τεχνητή νοημοσύνη δίπλα στη Βιομηχανική Επανάσταση, ανοίγοντας τη συζήτηση για την εργασία, τον πόλεμο και την ανθρώπινη αξιοπρέπεια.

Tags

ΕΓΓΡΑΦΕΙΤΕ ΣΤΟ NEWSLETTER ΜΑΣ

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Διεθνή / Τραμπ: Εκτελεστικό διάταγμα για τον τερματισμό των ομοσπονδιακών παροχών σε παράτυπους μετανάστες

Διεθνή / Τραμπ και Μασκ αντάλλαξαν λόγια αγάπης στη κοινή συνέντευξή τους: «Προσπαθούν να μας χωρίσουν»

ΔΙΑΒΑΖΟΝΤΑΙ ΤΩΡΑ

Κωνσταντοπούλου για Τσίπρα: «Του είπα αυτό είναι τρίτο μνημόνιο και μου είπε "μη λες τέτοιες λέξεις"»

Αυτές είναι οι συναυλίες του φετινού καλοκαιριού

Έκτακτο επίδομα παιδιού: Οι δικαιούχοι, τα ποσά και τα εισοδηματικά κριτήρια

Τάνια Τσανακλίδου: «Η απάθεια του κόσμου είναι που με τρομάζει περισσότερο»

Γερμανία: Εξιχνιάστηκε η δολοφονία της «Ντιάνα Σ.» 25 χρόνια αφότου βρέθηκε νεκρή σε ποταμό

Πυροβολισμοί στην Ισπανία: Δύο νεκροί και τέσσερις τραυματίες στην Αλμερία

ΔΕΙΤΕ ΑΚΟΜΑ

Διεθνή / Ο Πάπας ετοιμάζει την πρώτη μεγάλη εγκύκλιο για την AI και τη βλέπει ως τη νέα Βιομηχανική Επανάσταση

Τech & Science / ΗΠΑ: Το Ανώτατο Δικαστήριο δεν αποφάσισε αν το X μπορεί να διωχθεί για βίντεο με σεξουαλικό περιεχόμενο ανηλίκων

Τech & Science / Ο Έλον Μασκ χάνει τη δίκη εναντίον της OpenAI: Η επιτροπή των ενόρκων αποφάνθηκε υπέρ του Σαμ Άλτμαν

Τech & Science / Καρκίνος του πνεύμονα: Η επιστήμη ένα βήμα πιο κοντά σε εξέταση αίματος για τον εντοπισμό του

Τech & Science / Το feed είναι ψεύτικο: ποιος κατασκευάζει αυτά που νομίζουμε ότι έγιναν viral;

Τech & Science / Η νέα Siri της Apple θα λειτουργεί σαν το ChatGPT και θα διαγράφει αυτόματα τις συνομιλίες

Τech & Science / Η AI ανέβηκε στο βήμα της αποφοίτησης και οι φοιτητές τη γιούχαραν

Πολιτισμός / Ο Τζον Λένον, η AI και η τελευταία συνέντευξη πριν από τη δολοφονία του

Τech & Science / Η φιλική απόρριψη είναι εξίσου οδυνηρή με την ερωτική απογοήτευση

Τech & Science / Είχαν διασταυρωθεί ο Homo erectus και οι Ντενίσοβαν; Πρωτεΐνες δοντιών αποκαλύπτουν νέα στοιχεία

Τech & Science / Πόσο ανησυχητική είναι η έξαρση του ιού Έμπολα στη Λαϊκή Δημοκρατία του Κονγκό;

Τech & Science / Διαστημική αποστολή θα παρατηρήσει πώς η Γη προστατεύεται από τους ηλιακούς ανέμους

Τech & Science / Μελέτη της Οξφόρδης απαντά γιατί σχεδόν όλοι οι άνθρωποι είναι δεξιόχειρες

Τech & Science / Άνοια: Πώς ένα νέο «σκορ» αξιολογεί τον κίνδυνο με βάση τον τρόπο ζωής

Τech & Science / OpenAI: Το ChatGPT θα συνδέεται πλέον με τραπεζικούς λογαριασμούς

Τech & Science / Επιστήμονες ανακάλυψαν φυσικά «φρένα» που εμποδίζουν τεράστιους σεισμούς

Τech & Science / Η NASA χαρτογράφησε τη Γη τη νύχτα: Ποιες χώρες «σβήνουν» και ποιες φωτίζονται όλο και περισσότερο

Τech & Science / Το νέο λογότυπο του Spotify για τα 20 χρόνια ίδρυσής του

Τech & Science / Meta: Τα νέα Ray-Ban γυαλιά θα γράφουν μηνύματα με κινήσεις των χεριών

Τech & Science / Τι λέει το αγαπημένο σου άλμπουμ της Madonna για το Grindr προφίλ σου;