ΣΥΜΒΑΙΝΕΙ ΤΩΡΑ

Η Microsoft δημιούργησε ένα Bot που μιμείται τη φωνή σου αφού την ακούσει για 3 δευτερόλεπτα

Η Microsoft δημιούργησε ένα Bot που μιμείται τη φωνή σου αφού την ακούσει για 3 δευτερόλεπτα Facebook Twitter
Φωτ.: Unsplash.
0

Ερευνητές της Microsoft ανακοίνωσαν τη δημιουργία του «VALL-E», ενός Bot που μετατρέπει γραπτά κείμενα σε ομιλία και μπορεί να μιμηθεί τη φωνή ενός ατόμου μετά από ένα σύντομο ηχητικό δείγμα μόλις τριών δευτερολέπτων.

Είναι χαρακτηριστικό ότι το εν λόγω εργαλείο μπορεί ακόμη και να μιμηθεί τα συναισθήματα και τον τόνο που υιοθετεί ένας ομιλητής.Το Bot έχει εκπαιδευτεί σε 60.000 ώρες αγγλικής ομιλίας από το LibriLight, μια βιβλιοθήκη ήχου που έχει δημιουργήσει η Meta. Εκτός από την αναπαραγωγή των μοτίβων ομιλίας ενός ατόμου, μπορεί να δημιουργήσει παρόμοια ομιλία με λέξεις που δεν έχουν χρησιμοποιηθεί από τον αρχικό ομιλητή. 

Η Microsoft μοιράστηκε ορισμένα από τα αποτελέσματα του «VALL-E» σε έναν ειδικό ιστότοπο. Από ό,τι φαίνεται, το εργαλείο αποδίδει αρκετά πειστικό «ανθρώπινο» ήχο, αν και ορισμένες ομιλίες συνεχίζουν να μοιάζουν με «ρομποτικές».

Βέβαια, ας μην ξεχνάμε ότι τα εν λόγω αποτελέσματα προκύπτουν με ένα σύνολο δεδομένων από τρία δευτερόλεπτα ανθρώπινης ομιλίας. Ως εκ τούτου, με ένα πλουσιότερο σύνολο δεδομένων, το VALL-E πιθανότατα θα έχει πολύ καλύτερες επιδόσεις.

Η εταιρεία δεν διαθέτει ακόμη τις ικανότητες του VALL-E στο κοινό, λαμβάνοντας υπόψη τους κινδύνους που μπορούν να προκύψουν από την ανεξέλεγκτη χρήση του, όπως η αναπαραγωγή ψευδών ειδήσεων. 

«Δεδομένου ότι το VALL-E θα μπορούσε να συνθέσει ομιλία από συγκεκριμένο ομιλητή μπορεί να ενέχει πιθανούς κινδύνους στην κακή χρήση του μοντέλου, όπως η πλαστοπροσωπία ενός συγκεκριμένου ομιλητή», αναγνωρίζει οι ερευνητές της Microsoft.

Ωστόσο, η ερευνητική ομάδα προσθέτει ότι είναι δυνατό να αναπτυχθεί ένα σύστημα που θα ανιχνεύει αν ένα ηχητικό κλιπ δημιουργήθηκε από το VALL-E.

Με πληροφορίες από Design Taxi

Τech & Science
0

ΣΥΜΒΑΙΝΕΙ ΤΩΡΑ

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

ΔΕΙΤΕ ΑΚΟΜΑ

Η Meta παρουσίασε τα πρώτα Ray-Ban με ενσωματωμένη οθόνη επαυξημένης πραγματικότητας

Τech & Science / Η Meta παρουσίασε τα πρώτα Ray-Ban με ενσωματωμένη οθόνη επαυξημένης πραγματικότητας

Ο Μαρκ Ζούκερμπεργκ παρουσίασε τα γυαλιά στο συνέδριο Meta Connect στην Καλιφόρνια, σημειώνοντας ότι «τα γυαλιά είναι το μόνο μέσο όπου η τεχνητή νοημοσύνη μπορεί να δει και να ακούσει ό,τι βλέπεις κι ακούς εσύ»
LIFO NEWSROOM
Νέο εργαλείο AI προβλέπει τον κίνδυνο για 1.000 ασθένειες έως και 20 χρόνια πριν

Τech & Science / Νέο εργαλείο AI προβλέπει τον κίνδυνο για 1.000 ασθένειες έως και 20 χρόνια πριν

Λαμβάνει υπόψη το ιατρικό ιστορικό, βασικά δημογραφικά στοιχεία και παράγοντες τρόπου ζωή ώστε να εκτιμήσει αν και πότε μπορεί να εμφανιστούν παθήσεις όπως καρκίνος, διαβήτης και καρδιολογικά ή αναπνευστικά νοσήματα
LIFO NEWSROOM
Η Σελήνη «πωλείται»: Φινλανδική εταιρεία αγόρασε ήδη πόρους - Τι είναι το Ήλιο-3

Τech & Science / Η Σελήνη «πωλείται»: Φινλανδική εταιρεία αγόρασε ήδη πόρους - Τι είναι το Ήλιο-3

Το ηλιακό φως «βομβαρδίζει» το φεγγάρι με Ήλιο-3 εδώ και 4 δισεκατομμύρια χρόνια - Επειδή η Σελήνη δεν έχει μαγνητικό πεδίο, το ισότοπο παραμένει στην επιφάνεια, αντίθετα με τη Γη, όπου απορρίπτεται στο διάστημα
LIFO NEWSROOM
Πώς χρησιμοποιούν οι άνθρωποι το ChatGPT – Η μεγαλύτερη μέχρι σήμερα μελέτη

Τech & Science / Πώς χρησιμοποιούν οι άνθρωποι το ChatGPT – Η μεγαλύτερη μέχρι σήμερα μελέτη

Η μελέτη αποδεικνύει ότι το μοντέλο δεν χρησιμοποιείται μόνο για την επιτάχυνση επαγγελματικών διαδικασιών αλλά και για να εμπλουτίσει την καθημερινή ζωή εκατομμυρίων ανθρώπων παγκοσμίως
LIFO NEWSROOM
Η Apple αποκλείει τους Ευρωπαίους χρήστες από τη νέα λειτουργία ζωντανής μετάφρασης των AirPods Pro

Τech & Science / Η Apple αποκλείει τους Ευρωπαίους χρήστες από τη νέα λειτουργία ζωντανής μετάφρασης των AirPods Pro

H λειτουργία «Live Translation with AirPods», που αποτελεί μέρος του Apple Intelligence, δεν θα ενεργοποιείται εάν ο χρήστης βρίσκεται εντός ΕΕ και ο λογαριασμός Apple ανήκει σε περιοχή της ΕΕ
LIFO NEWSROOM