Τα «AI Overviews» της Google, δηλαδή οι απαντήσεις που δημιουργούνται με τεχνητή νοημοσύνη και εμφανίζονται στην κορυφή των αποτελεσμάτων αναζήτησης, είναι σε μεγάλο βαθμό ακριβή, αλλά εξακολουθούν να παρουσιάζουν σημαντικό αριθμό λαθών.
Σύμφωνα με ανάλυση της εταιρείας τεχνητής νοημοσύνης Oumi για τους New York Times, τα αποτελέσματα είναι σωστά περίπου στο 85% έως 91% των περιπτώσεων, ανάλογα με την έκδοση του μοντέλου που χρησιμοποιείται. Ωστόσο, δεδομένου του όγκου των αναζητήσεων, αυτό μεταφράζεται σε εκατομμύρια εσφαλμένες απαντήσεις.
Ένα από τα βασικά προβλήματα είναι ότι ακόμη και όταν οι απαντήσεις είναι σωστές, συχνά δεν στηρίζονται επαρκώς στις πηγές που παρατίθενται. Σε πολλές περιπτώσεις, τα links που συνοδεύουν την απάντηση είτε δεν περιέχουν τη συγκεκριμένη πληροφορία είτε δίνουν αντικρουόμενα στοιχεία, καθιστώντας δύσκολο τον ουσιαστικό έλεγχο της ακρίβειας.
Τα παραδείγματα είναι ενδεικτικά. Σε ερώτηση για το πότε μετατράπηκε το σπίτι του Bob Marley σε μουσείο, το σύστημα έδωσε λάθος χρονολογία, ενώ οι πηγές που επικαλέστηκε ήταν ασαφείς ή αντιφατικές. Ακόμη και όταν η βασική απάντηση είναι σωστή, το σύστημα μπορεί να εισάγει λάθη στο συνοδευτικό πλαίσιο. Για παράδειγμα, σε ερώτηση για την ηλικία θανάτου ενός αθλητή, έδωσε τη σωστή ηλικία αλλά λανθασμένη ημερομηνία θανάτου.
Πρόβλημα εντοπίζεται και στην επιλογή των πηγών. Η ανάλυση έδειξε ότι το Facebook και το Reddit εμφανίζονται συχνά ως πηγές, ακόμη και σε περιπτώσεις όπου οι απαντήσεις είναι ανακριβείς, αυξάνοντας τον κίνδυνο διάδοσης παραπλανητικών πληροφοριών.
Η απάντηση της Google μετά την έρευνα
Το σύστημα παρουσιάζει και αστάθεια, καθώς η ίδια ερώτηση μπορεί να δώσει διαφορετικές απαντήσεις σε διαφορετικές χρονικές στιγμές, ακόμη και μέσα σε λίγα δευτερόλεπτα.
Παράλληλα, υπάρχει και ο κίνδυνος χειραγώγησης. Περιεχόμενο χαμηλής αξιοπιστίας, όπως αναρτήσεις σε blogs ή προσωπικές σελίδες, μπορεί να εμφανιστεί ως έγκυρη πληροφορία στις απαντήσεις της τεχνητής νοημοσύνης.
Η Google αναγνωρίζει ότι το σύστημα μπορεί να κάνει λάθη και καλεί τους χρήστες να διασταυρώνουν τις πληροφορίες. Ωστόσο, υποστηρίζει ότι τέτοιες μετρήσεις δεν αποτυπώνουν πλήρως τον τρόπο με τον οποίο χρησιμοποιείται η αναζήτηση στην πράξη.
Με πληροφορίες από New York Times