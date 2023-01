Ερευνητές της Microsoft ανακοίνωσαν τη δημιουργία του «VALL-E», ενός Bot που μετατρέπει γραπτά κείμενα σε ομιλία και μπορεί να μιμηθεί τη φωνή ενός ατόμου μετά από ένα σύντομο ηχητικό δείγμα μόλις τριών δευτερολέπτων.

Είναι χαρακτηριστικό ότι το εν λόγω εργαλείο μπορεί ακόμη και να μιμηθεί τα συναισθήματα και τον τόνο που υιοθετεί ένας ομιλητής.Το Bot έχει εκπαιδευτεί σε 60.000 ώρες αγγλικής ομιλίας από το LibriLight, μια βιβλιοθήκη ήχου που έχει δημιουργήσει η Meta. Εκτός από την αναπαραγωγή των μοτίβων ομιλίας ενός ατόμου, μπορεί να δημιουργήσει παρόμοια ομιλία με λέξεις που δεν έχουν χρησιμοποιηθεί από τον αρχικό ομιλητή.

Η Microsoft μοιράστηκε ορισμένα από τα αποτελέσματα του «VALL-E» σε έναν ειδικό ιστότοπο. Από ό,τι φαίνεται, το εργαλείο αποδίδει αρκετά πειστικό «ανθρώπινο» ήχο, αν και ορισμένες ομιλίες συνεχίζουν να μοιάζουν με «ρομποτικές».

Βέβαια, ας μην ξεχνάμε ότι τα εν λόγω αποτελέσματα προκύπτουν με ένα σύνολο δεδομένων από τρία δευτερόλεπτα ανθρώπινης ομιλίας. Ως εκ τούτου, με ένα πλουσιότερο σύνολο δεδομένων, το VALL-E πιθανότατα θα έχει πολύ καλύτερες επιδόσεις.

