Οι περισσότεροι άνθρωποι δεν μπορούν πλέον να ξεχωρίσουν τις ανθρώπινες φωνές από τις εκείνες που δημιουργεί η τεχνητή νοημοσύνη, αποκαλύπτει νέα έρευνα.

Η τεχνητή νοημοσύνη (AI) έχει γίνει πλέον ένα κοινό και αναπόσπαστο μέρος της καθημερινότητάς μας. Τη βλέπουμε να «γράφει» στα μέσα κοινωνικής δικτύωσης, της μιλάμε μέσα από μεγάλα γλωσσικά μοντέλα, και την ακούμε κάθε φορά που η Alexa της Amazon ανταποκρίνεται σε κάποια εντολή.

Ωστόσο, φαίνεται πως όσο η τεχνολογία εξελίσσεται με ταχύτατους ρυθμούς, γίνεται όλο και πιο δύσκολο να ξεχωρίσουμε τι είναι αληθινό και τι όχι.

Σε μια νέα μελέτη που δημοσιεύτηκε στο επιστημονικό περιοδικό PLoS One, οι ερευνητές διαπίστωσαν ότι οι περισσότεροι άνθρωποι δεν μπορούν πλέον να διακρίνουν τις φωνές που παράγονται από τεχνητή νοημοσύνη από τις ανθρώπινες φωνές από τις οποίες κλωνοποιήθηκαν.

Πώς έγινε η έρευνα

Οι συμμετέχοντες άκουσαν 80 διαφορετικά δείγματα φωνών – οι μισές ήταν φωνές AI και οι άλλες μισές ανθρώπινες. Στη συνέχεια, τους ζητήθηκε να βαθμολογήσουν τις φωνές ανάλογα με το πόσο αξιόπιστες ή κυριαρχικές τους φάνηκαν.

Μέσα στην κατηγορία των φωνών AI υπήρχαν δύο τύποι:

Γενικές (generic) φωνές που είχαν δημιουργηθεί από το μηδέν, και Κλωνοποιημένες φωνές, δηλαδή συνθετικές φωνές βασισμένες σε ηχογραφήσεις πραγματικών ανθρώπων.

Οι περισσότεροι αναγνώρισαν εύκολα ότι οι γενικές φωνές AI ήταν ψεύτικες.

Ωστόσο, οι κλωνοποιημένες φωνές ήταν πολύ πιο δύσκολο να ξεχωρίσουν, καθώς το 58% αυτών θεωρήθηκαν λανθασμένα ως ανθρώπινες.

Αντίστοιχα, το 62% των πραγματικών ανθρώπινων φωνών αναγνωρίστηκαν σωστά ως ανθρώπινες.

«Οι φωνές-κλώνοι ακούγονται τόσο ανθρώπινες όσο και οι πραγματικές»

«Το πιο σημαντικό εύρημα της έρευνας είναι ότι οι φωνές που παράγονται από τεχνητή νοημοσύνη, και ειδικότερα οι φωνές-κλώνοι, ακούγονται το ίδιο ανθρώπινες με τις πραγματικές ηχογραφήσεις ανθρώπων», δήλωσε η Δρ. Nadine Lavan, κύρια συγγραφέας της μελέτης και λέκτορας ψυχολογίας στο Πανεπιστήμιο Queen Mary του Λονδίνου, μιλώντας στο Euronews Next.

«Αυτό είναι ιδιαίτερα εντυπωσιακό», πρόσθεσε, «διότι χρησιμοποιήσαμε εμπορικά διαθέσιμα εργαλεία, με τα οποία ο καθένας μπορεί να δημιουργήσει ρεαλιστικές φωνές χωρίς να πληρώσει μεγάλα ποσά ή να έχει ειδικές τεχνικές γνώσεις».

Πώς λειτουργεί η τεχνολογία κλωνοποίησης φωνής

Η τεχνολογία AI voice cloning λειτουργεί αναλύοντας και εξάγοντας τα βασικά χαρακτηριστικά μιας φωνής από ηχογραφημένα δεδομένα.

Εξαιτίας αυτής της ικανότητας να μιμείται με τόση ακρίβεια, έχει γίνει ένα δημοφιλές εργαλείο τηλεφωνικών απατεώνων, οι οποίοι συχνά χρησιμοποιούν αναρτήσεις στα μέσα κοινωνικής δικτύωσης για να αντιγράψουν τις φωνές αγαπημένων προσώπων των θυμάτων τους.

Οι ηλικιωμένοι είναι οι πιο ευάλωτοι: σύμφωνα με έρευνα του Πανεπιστημίου του Πόρτσμουθ, τουλάχιστον τα δύο τρίτα των ατόμων άνω των 75 ετών έχουν δεχθεί απόπειρα τηλεφωνικής απάτης, ενώ σχεδόν το 60% αυτών των προσπαθειών γίνεται μέσω φωνητικών κλήσεων.

Αν και δεν χρησιμοποιούνται σε όλες τις περιπτώσεις φωνές AI, η διάδοση της τεχνολογίας αυτής αυξάνεται ραγδαία, χάρη στην ευκολία πρόσβασης και τη ρεαλιστικότητά της.

Μεταξύ των πιο γνωστών παραδειγμάτων λογισμικού είναι το Hume AI και το ElevenLabs.

Νομικές και ηθικές ανησυχίες

Η κλωνοποίηση φωνών μέσω AI έχει προκαλέσει ανησυχία και στον χώρο της ψυχαγωγίας, καθώς φωνές διασήμων έχουν χρησιμοποιηθεί χωρίς άδεια.

Πέρυσι, η Σκάρλετ Γιόχανσον κατήγγειλε ότι η OpenAI χρησιμοποίησε μια φωνή στο ChatGPT που έμοιαζε ανησυχητικά με τη δική της από την ταινία «Her».

Υπάρχουν επίσης οι «deepfake» ηχογραφήσεις, οι οποίες έχουν μιμηθεί πολιτικούς ή δημοσιογράφους, προσπαθώντας να επηρεάσουν την κοινή γνώμη και να διαδώσουν παραπληροφόρηση.

Καθώς αυτές οι ανησυχητικές καταχρήσεις συνεχίζουν να εξαπλώνονται, η Δρ. Lavan πιστεύει ότι οι δημιουργοί της τεχνολογίας AI έχουν ευθύνη να εφαρμόσουν ισχυρότερα μέτρα προστασίας.

Η θετική πλευρά

Όπως κάθε τεχνολογία, έτσι και οι φωνές τεχνητής νοημοσύνης μπορούν να έχουν θετικές εφαρμογές - ιδιαίτερα για άτομα που δεν μπορούν να μιλήσουν ή έχουν δυσκολία στην ομιλία.

«Αυτή η μορφή βοηθητικής τεχνολογίας χρησιμοποιείται εδώ και καιρό, με τον Στίβεν Χόκινγκ να αποτελεί ένα από τα πιο γνωστά παραδείγματα», εξήγησε η Lavan.

«Το νέο στοιχείο, όμως, είναι η δυνατότητα προσωποποίησης των συνθετικών φωνών με τρόπους που παλαιότερα ήταν αδύνατοι».

Σήμερα, οι χρήστες μπορούν να επιλέξουν να αναδημιουργήσουν τη δική τους φωνή, αν το επιθυμούν, ή να σχεδιάσουν μια εντελώς νέα φωνή που να αντικατοπτρίζει την ταυτότητα και το προσωπικό τους στυλ.

Η Lavan σημείωσε επίσης ότι, εφόσον η τεχνολογία χρησιμοποιηθεί ηθικά και υπεύθυνα, μπορεί να βελτιώσει την προσβασιμότητα και τη διαφορετικότητα στην εκπαίδευση, τη ραδιοφωνία και την παραγωγή ηχητικών βιβλίων.

Για παράδειγμα, πρόσφατη μελέτη έδειξε ότι η εκμάθηση με υποστήριξη AI βελτίωσε τη κίνητρα και τη συμμετοχή των μαθητών στην ανάγνωση — ειδικά εκείνων με ΔΕΠΥ (ADHD).

«Ένα ακόμη συναρπαστικό βήμα», πρόσθεσε, «είναι η δυνατότητα να κλωνοποιηθεί μια φωνή σε διαφορετικές γλώσσες, επιτρέποντας στους ανθρώπους να εκφράζονται σε πολλές γλώσσες διατηρώντας τη φωνητική τους ταυτότητα. Αυτό θα μπορούσε να είναι επαναστατικό για την παγκόσμια επικοινωνία, την προσβασιμότητα και την πολιτισμική ανταλλαγή».

Το μέλλον της φωνής της τεχνητής νοημοσύνης

Καθώς οι τεχνητές φωνές γίνονται όλο και πιο παρούσες στην καθημερινότητά μας, οι τρόποι με τους οποίους τις χρησιμοποιούμε και αλληλεπιδρούμε μαζί τους θα συνεχίσουν να εξελίσσονται.

Η Lavan δήλωσε ότι επιθυμεί να συνεχίσει την έρευνα, εστιάζοντας στο πώς οι άνθρωποι αντιλαμβάνονται τις φωνές που παράγει η AI.

«Θα ήθελα πολύ να μελετήσω σε βάθος πώς το γεγονός ότι κάποιος γνωρίζει αν μια φωνή είναι τεχνητή ή όχι επηρεάζει τον τρόπο που αλληλεπιδρά μαζί της», είπε.

«Εξίσου ενδιαφέρον θα ήταν να δούμε πώς οι άνθρωποι θα αντιλαμβάνονταν φωνές τεχνητής νοημοσύνης που ακούγονται ευχάριστες αλλά προφανώς μη ανθρώπινες. Για παράδειγμα: θα ήταν περισσότερο ή λιγότερο πιθανό να ακολουθήσουν οδηγίες από τέτοιες φωνές; Θα ήταν περισσότερο ή λιγότερο πιθανό να θυμώσουν όταν κάτι πάει στραβά;»

«Όλα αυτά τα ερωτήματα είναι εξαιρετικά ενδιαφέροντα από ερευνητική σκοπιά», κατέληξε, «και μπορούν να μας πουν πολλά για το τι πραγματικά έχει σημασία στις ανθρώπινες αλληλεπιδράσεις».

Με πληροφορίες από euronews.com