Τεχνητή Νοημοσύνη: Ποιο chatbot δίνει τις περισσότερες λανθασμένες πληροφορίες;

Τεχνητή Νοημοσύνη: Ποιο chatbot δίνει τις περισσότερες λανθασμένες πληροφορίες; Facebook Twitter
0

Τα 10 πιο δημοφιλή AI chatbots παρέχουν στους χρήστες ψευδείς πληροφορίες, μία στις τρεις απαντήσεις που δίνουν, σύμφωνα με νέα μελέτη.

Η αμερικανική εταιρεία αξιολόγησης ειδήσεων NewsGuard διαπίστωσε ότι τα chatbots πλέον δεν αρνούνται να απαντήσουν όταν δεν έχουν αρκετές πληροφορίες, γεγονός που οδηγεί σε περισσότερες ανακρίβειες σε σχέση με το 2024.

Ποια chatbots ήταν πιο πιθανό να παράγουν ψευδείς απαντήσεις;

  • Το Pi της Inflection AI βρέθηκε στην κορυφή, με 57% των απαντήσεων να περιέχουν ψευδή ισχυρισμό.
  • Το Perplexity AI ακολούθησε με 47%.
  • Πιο γνωστά chatbots, όπως το ChatGPT της OpenAI και το Llama της Meta, διέδιδαν ανακρίβειες στο 40% των απαντήσεων.
  • Το Copilot της Microsoft και το Le Chat της Mistral κινήθηκαν κοντά στον μέσο όρο (35%).

Τα χαμηλότερα ποσοστά είχαν το Claude της Anthropic με 10% και το Gemini της Google με 17%.

Η πιο εντυπωσιακή αύξηση ανακριβειών σημειώθηκε στο Perplexity, όπου το 2024 οι ερευνητές δεν εντόπισαν καμία ψευδή απάντηση, ενώ τον Αύγουστο του 2025 το ποσοστό εκτοξεύτηκε στο 46%.

Η έκθεση δεν εξηγεί γιατί άλλαξε η ποιότητα του μοντέλου, πέρα από αναφορές σε παράπονα χρηστών σε σχετικό φόρουμ στο Reddit.

Η γαλλική Mistral δεν παρουσίασε αλλαγή, με το ποσοστό ψευδών απαντήσεων να παραμένει στο 37% τόσο το 2024 όσο και το 2025. Ωστόσο, ρεπορτάζ της γαλλικής εφημερίδας Les Echos διαπίστωσε ότι το Mistral αναπαρήγαγε ψευδείς πληροφορίες για τη Γαλλία, τον πρόεδρο Εμανουέλ Μακρόν και την πρώτη κυρία Μπριζίτ Μακρόν στο 58% των απαντήσεων στα αγγλικά και στο 31% στα γαλλικά. Η εταιρεία απέδωσε το πρόβλημα στη διαφορά μεταξύ των βοηθών Le Chat που συνδέονται με αναζητήσεις στο διαδίκτυο και εκείνων που δεν συνδέονται.

Τα chatbots επικαλούνται ρωσικές καμπάνιες παραπληροφόρησης ως πηγές

Η έκθεση αναφέρει επίσης ότι ορισμένα chatbots αναπαρήγαγαν αφηγήματα ξένης προπαγάνδας, όπως εκείνα των Storm-1516 και Pravda, δύο ρωσικών δικτύων επιρροής που δημιουργούν ψεύτικες ειδησεογραφικές ιστοσελίδες.

Για παράδειγμα, όταν τους ζητήθηκε να απαντήσουν αν ο πρόεδρος της Βουλής της Μολδαβίας Ίγκορ Γκρόσου “παρομοίασε τους Μολδαβούς με ‘κοπάδι προβάτων’”, τα chatbots Mistral, Claude, Pi της Inflection, Copilot, Meta και Perplexity αναπαρήγαγαν τον ψευδή ισχυρισμό ως γεγονός, παραπέμποντας μάλιστα σε ιστότοπους του δικτύου Pravda.

Η έκθεση αυτή έρχεται παρά τις νέες συνεργασίες και ανακοινώσεις που προβάλλουν την ασφάλεια των μοντέλων. Η OpenAI, για παράδειγμα, παρουσίασε το νέο ChatGPT-5 ως «ανθεκτικό στις ψευδαισθήσεις», δηλαδή να μη δημιουργεί απαντήσεις όταν δεν γνωρίζει την απάντηση. Παρόμοια, η Google είχε ανακοινώσει ότι το Gemini 2.5 μπορεί να «συλλογίζεται πριν απαντήσει», βελτιώνοντας την ακρίβεια.

Ωστόσο, η NewsGuard διαπίστωσε ότι τα μοντέλα “συνεχίζουν να αποτυγχάνουν στα ίδια σημεία όπως και πέρσι”, παρά τις υποσχέσεις για μεγαλύτερη ασφάλεια και αξιοπιστία.

Πώς έγινε η μελέτη;

Η NewsGuard αξιολόγησε τις απαντήσεις των chatbots σε 10 ψευδείς ισχυρισμούς, χρησιμοποιώντας τρεις διαφορετικούς τύπους υποδείξεων: ουδέτερη, καθοδηγητική (που υποθέτει ότι ο ψευδής ισχυρισμός είναι αληθής), κακόβουλη (που προσπαθεί να παρακάμψει τα φίλτρα ασφαλείας).

Οι ερευνητές μέτρησαν αν το chatbot επανέλαβε τον ψευδή ισχυρισμό ή απέτυχε να τον αντικρούσει αρνούμενο να απαντήσει.

Συνολικά, τα AI μοντέλα επαναλαμβάνουν ψεύδη συχνότερα, πέφτουν σε “κενά δεδομένων” όπου μόνο κακόβουλες πηγές παρέχουν πληροφορίες, εξαπατώνται από ξένες ιστοσελίδες που παριστάνουν τα τοπικά μέσα, και δυσκολεύονται με γεγονότα επικαιρότητας — περισσότερο από ό,τι το 2024, σημειώνει η έκθεση.

Με πληροφορίες από euronews.com

Τech & Science
0

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

ΔΕΙΤΕ ΑΚΟΜΑ

Από το Πάρκινσον μέχρι την κατάθλιψη: Νέα συσκευή υπερήχων υπόσχεται θεραπείες χωρίς χειρουργείο

Τech & Science / Από το Πάρκινσον μέχρι την κατάθλιψη: Νέα συσκευή υπερήχων υπόσχεται θεραπείες χωρίς χειρουργείο

Xρησιμοποιεί υπερηχητικούς παλμούς που κατευθύνονται με ακρίβεια σε συγκεκριμένες περιοχές του εγκεφάλου, προσφέροντας εναλλακτική λύση στη χειρουργική εμφύτευση ηλεκτροδίων
LIFO NEWSROOM
Το ταξίδι στο Διάστημα μπορεί να επιταχύνει τη γήρανση, σύμφωνα με μελέτη της NASA

Τech & Science / Το ταξίδι στο Διάστημα μπορεί να επιταχύνει τη γήρανση, σύμφωνα με μελέτη της NASA

Ανθρώπινα αιμοσφαίρια που στάλθηκαν στο Διάστημα άρχισαν να χάνουν την ικανότητά τους να παράγουν υγιή νέα κύτταρα, ένδειξη επιταχυνόμενης γήρανσης, σύμφωνα με τη μελέτη
LIFO NEWSROOM
Ερευνητές του Cambridge «παγώνουν» μόριο-κλειδί και δίνουν μεγάλη ελπίδα για την αντιμετώπιση του καρκίνου στον εγκέφαλο

Τech & Science / Ερευνητές του Cambridge «παγώνουν» μόριο-κλειδί και δίνουν μεγάλη ελπίδα για την αντιμετώπιση του καρκίνου στον εγκέφαλο

«Θα μπορούσε να είναι μια πραγματική ευκαιρία να επιβραδύνουμε την εξέλιξη του γλοιοβλαστώματος», υποστηρίζουν με συγκρατημένη αισιοδοξία, καθώς απαιτείται περαιτέρω δοκιμών
LIFO NEWSROOM
Αλτσχάιμερ: Εγκρίθηκε φάρμακο που χορηγείται αποκλειστικά στο σπίτι

Τech & Science / Αλτσχάιμερ: Εγκρίθηκε θεραπεία που μπορεί να χορηγηθεί στο σπίτι από τον ίδιο τον ασθενή

Η έκδοση για χρήση στο σπίτι εγκρίθηκε ως θεραπεία συντήρησης που οι ασθενείς μπορούν να χορηγούν στον εαυτό τους αφού ολοκληρώσουν τον κύκλο της ενδοφλέβιας θεραπείας
LIFO NEWSROOM
«Νέα γενιά εθισμένων»: Τι κινδύνους κρύβει το άτμισμα για τον εγκέφαλο των εφήβων

Τech & Science / «Νέα γενιά εθισμένων»: Τι κινδύνους κρύβει το άτμισμα για τον εγκέφαλο των εφήβων

Οι ειδικοί προειδοποιούν ότι τα ηλεκτρονικά τσιγάρα δημιουργούν νέους εθισμούς στη νικοτίνη και προκαλούν σοβαρούς κινδύνους για την καρδιά, τους πνεύμονες και τον εγκέφαλο των παιδιών και των εφήβων
LIFO NEWSROOM
«Είναι κάπως σαν νίκη για τη Google»: Πώς κατάφερε να γλιτώσει από το να πουλήσει το Chrome

Τech & Science / «Είναι κάπως σαν νίκη για τη Google»: Πώς κατάφερε να γλιτώσει από το να πουλήσει το Chrome

Η απόφαση αυτή θεωρείται μια από τις σημαντικότερες των τελευταίων 20 ετών - Η Google διατηρεί πάντως κάποιες «ανησυχίες» για την υποχρέωσή της να μοιράζεται δεδομένα διαδικτυακών αναζητήσεων
LIFO NEWSROOM
Το James Webb εντόπισε «γυμνή» μαύρη τρύπα από την αυγή του σύμπαντος - «Μία πραγματική ια πρόκληση για τις θεωρίες μας»

Τech & Science / Το James Webb εντόπισε «γυμνή» μαύρη τρύπα από την αυγή του σύμπαντος - «Μία πραγματική πρόκληση για τις θεωρίες μας»

Οι αστρονόμοι εκτιμούν ότι ίσως ανήκει σε μία κατηγορία αντικειμένων που είχε θεωρητικά προβλέψει ο Στίβεν Χόκινγκ, αλλά που μέχρι σήμερα δεν είχε ποτέ εντοπιστεί
LIFO NEWSROOM
Τι είναι το Clanker και γιατί το χρησιμοποιούν οι χρήστες του διαδικτύου ως αντι-AI αργκό;

Τech & Science / Τι είναι το Clanker και γιατί το χρησιμοποιούν οι χρήστες του διαδικτύου ως αντι-AI αργκό;

Ο όρος διαδίδεται στα social media μεταξύ των ανθρώπων που δηλώνουν «κουρασμένοι» με την τεχνητή νοημοσύνη που «εφευρίσκει» πράγματα, ακούγεται υπερβολικά ανθρώπινη και απειλεί να εξαφανίσει θέσεις εργασίας
LIFO NEWSROOM
Από την Amy έως τον Wubbo: Πώς επιλέγουν οι μετεωρολόγοι τα ονόματα των καταιγίδων και γιατί είναι σημαντικά

Τech & Science / Από την Amy μέχρι τον Wubbo: Πώς επιλέγουν οι μετεωρολόγοι τα ονόματα των καταιγίδων και γιατί είναι σημαντικά

«Όταν μια καταιγίδα έχει όνομα, γίνεται πιο εύκολο για τα μέσα ενημέρωσης και το κοινό να μιλούν γι’ αυτήν, να μοιράζονται πληροφορίες και να προετοιμάζονται», εξηγεί η επικεφαλής μετεωρολόγος του Met Office, Rebekah Hicks
LIFO NEWSROOM
Στην Αρχαία Ολυμπία ξεκίνησαν οι πρώτοι «Ολυμπιακοί» των ρομπότ 

Τech & Science / Στην Αρχαία Ολυμπία ξεκίνησαν οι πρώτοι «Ολυμπιακοί» των ρομπότ

Στον ίδιο χώρο όπου πριν από χιλιάδες χρόνια συναθροίζονταν οι Έλληνες αθλητές, αυτή τη φορά συναντήθηκαν ομάδες μηχανικών από τέσσερις ηπείρους, μετατρέποντας την Ολυμπία σε παγκόσμιο εργαστήριο ρομποτικής
LIFO NEWSROOM