Τεχνητή νοημοσύνη «διαβάζει» τα χείλη καλύτερα από τους ανθρώπους

Τεχνητή νοημοσύνη «διαβάζει» τα χείλη καλύτερα από τους ανθρώπους Facebook Twitter
0

Ερευνητές της Google και της βρετανικής θυγατρικής της Deep Mind, ανέπτυξαν ένα νέο πρόγραμμα τεχνητής νοημοσύνης που «διαβάζει» τα χείλη των ανθρώπων εξ αποστάσεως με μεγαλύτερη ακρίβεια όχι μόνο από κάθε άλλο μέχρι σήμερα, αλλά και από τους ανθρώπους με τη σχετική εξειδίκευση.

Επικεφαλής του προγράμματος είναι ένας νεαρός ελληνικής καταγωγής, ειδικός της πληροφορικής, ο Γιάννης Ασσαέλ.

  

Για τα εκατομμύρια των ανθρώπων που δεν μπορούν να ακούσουν, η ανάγνωση των χειλιών των άλλων αποτελεί ένα «παράθυρο» για την επικοινωνία, πέρα από τη νοηματική γλώσσα. Όμως το «διάβασμα» των χειλιών δεν είναι εύκολο και συχνά είναι ανακριβές.

Το νέο «έξυπνο» σύστημα εμφανίζει μέσο ποσοστό λαθών 41% στην ορθή κατανόηση των λέξεων που σχηματίζουν τα χείλη. Μπορεί να φαίνεται υψηλό αυτό το ποσοστό, αλλά η καλύτερη μέχρι σήμερα υπολογιστική μέθοδος είχε ποσοστό αποτυχίας 77%, συνεπώς το νέο πρόγραμμα έχει περιορίσει σχεδόν στο μισό τα λάθη.

Οι ερευνητές, με επικεφαλής τον Ασσαέλ και τον Μπρένταν Σίλινγκφορντ, οι οποίοι έκαναν τη σχετική προδημοσίευση στο arXiv, σύμφωνα με το «Science», δημιούργησαν αλγόριθμους καλύτερους από κάθε άλλους στο παρελθόν, που τα καταφέρνουν αποτελεσματικότερα και από επαγγελματίες αναγνώστες χειλιών.

Αν το νέο σύστημα τελειοποιηθεί και ενσωματωθεί σε ηλεκτρονικές συσκευές, όπως τα «έξυπνα» κινητά τηλέφωνα, μπορεί μελλοντικά να προσφέρει τη δυνατότητα ανάγνωσης των χειλιών στον καθένα.

Η δημιουργία αλγορίθμων που να μπορούν να διαβάσουν χείλη ήταν έως τώρα τρομερά δύσκολη.

Οι ερευνητές τροφοδότησαν το σύστημά τους με 140.000 ώρες βίντεο από το You Tube που έδειχναν ανθρώπους να μιλάνε στα αγγλικά, μαζί με τα αντίστοιχα απομαγνητοφωνημένα κείμενα.

Στη συνέχεια, άφησαν το σύστημα μηχανικής μάθησης μόνο του να μάθει να «παντρεύει» τις διαφορετικές κινήσεις των χειλιών με τα αντίστοιχα φωνήματα και τελικά με τις αντίστοιχες λέξεις.

Το σύστημα βασίζεται στα τεχνητά νευρωνικά δίκτυα, δηλαδή σε μια ομάδα αλγόριθμων που ο καθένας εκτελεί ένα διαφορετικό και απλούστερο έργο, ενώ ταυτόχρονα όλοι μαζί συνδέονται και συνεργάζονται για να επεξεργασθούν τις πληροφορίες, περίπου όπως κάνουν οι νευρώνες του ανθρώπινου εγκεφάλου.

Αφού το σύστημα «αυτο-εκπαιδεύθηκε», δοκιμάσθηκε από τους ερευνητές στην ανάγνωση των χειλιών των ανθρώπων ενός 37λεπτου βίντεο, που ποτέ πριν το σύστημα δεν είχε «δει».

Το πρόγραμμα έσφαλε στο 41% των λέξεων, αλλά οι άνθρωποι -ακόμη και οι ειδικοί στο διάβασμα του στόματος- που είδαν το ίδιο βίντεο, είχαν μέσο ποσοστό αποτυχίας 93% (πάντως σε πραγματικές συνθήκες και όχι παρακολούθησης βίντεο, το ποσοστό ανθρώπινης αποτυχίας είναι κάπως μικρότερο, καθώς ο ανθρώπινος εγκέφαλος μπορεί να αξιοποιήσει και άλλα στοιχεία, όπως η γλώσσα του σώματος αυτού που μιλάει).

Σε κάθε περίπτωση, αν και συνιστά πραγματική πρόοδο, είναι σαφές ότι ένα ποσοστό αποτυχίας της τάξης του 40% στην αναγνώριση των λέξεων σημαίνει ότι το σύστημα χρειάζεται ακόμη ουσιαστική βελτίωση.

Όταν αυτή υπάρξει, το σύστημα μπορεί να αξιοποιηθεί ευρύτερα και στην καθημερινότητα. Για παράδειγμα, όταν θα βλέπουμε στην τηλεόραση έναν ποδοσφαιριστή να βρίζει ένα διαιτητή ή έναν αντίπαλο παίκτη, αλλά φυσικά δεν ακούμε τι λέει, θα ξέρουμε πια τι είπε!

 

Ο Γιάννης Ασσαέλ υπήρξε μαθητής του Κολεγίου Ανατόλια της Θεσσαλονίκης και σπούδασε εφαρμοσμένη πληροφορική στο Πανεπιστήμιο Μακεδονίας (2008-2013).

Στη συνέχεια, έκανε μεταπτυχιακά (μάστερ) στην επιστήμη των υπολογιστών στο Πανεπιστήμιο της Οξφόρδης, όπου σήμερα ολοκληρώνει το διδακτορικό του πάνω στη μηχανική μάθηση, ενώ παράλληλα εργάζεται για τη Deep Mind της Google.

Με πληροφορίες από ΑΠΕ-ΜΠΕ

Τech & Science
0

ΔΕΙΤΕ ΑΚΟΜΑ

Από το Πάρκινσον μέχρι την κατάθλιψη: Νέα συσκευή υπερήχων υπόσχεται θεραπείες χωρίς χειρουργείο

Τech & Science / Από το Πάρκινσον μέχρι την κατάθλιψη: Νέα συσκευή υπερήχων υπόσχεται θεραπείες χωρίς χειρουργείο

Xρησιμοποιεί υπερηχητικούς παλμούς που κατευθύνονται με ακρίβεια σε συγκεκριμένες περιοχές του εγκεφάλου, προσφέροντας εναλλακτική λύση στη χειρουργική εμφύτευση ηλεκτροδίων
LIFO NEWSROOM
Το ταξίδι στο Διάστημα μπορεί να επιταχύνει τη γήρανση, σύμφωνα με μελέτη της NASA

Τech & Science / Το ταξίδι στο Διάστημα μπορεί να επιταχύνει τη γήρανση, σύμφωνα με μελέτη της NASA

Ανθρώπινα αιμοσφαίρια που στάλθηκαν στο Διάστημα άρχισαν να χάνουν την ικανότητά τους να παράγουν υγιή νέα κύτταρα, ένδειξη επιταχυνόμενης γήρανσης, σύμφωνα με τη μελέτη
LIFO NEWSROOM
Ερευνητές του Cambridge «παγώνουν» μόριο-κλειδί και δίνουν μεγάλη ελπίδα για την αντιμετώπιση του καρκίνου στον εγκέφαλο

Τech & Science / Ερευνητές του Cambridge «παγώνουν» μόριο-κλειδί και δίνουν μεγάλη ελπίδα για την αντιμετώπιση του καρκίνου στον εγκέφαλο

«Θα μπορούσε να είναι μια πραγματική ευκαιρία να επιβραδύνουμε την εξέλιξη του γλοιοβλαστώματος», υποστηρίζουν με συγκρατημένη αισιοδοξία, καθώς απαιτείται περαιτέρω δοκιμών
LIFO NEWSROOM
Αλτσχάιμερ: Εγκρίθηκε φάρμακο που χορηγείται αποκλειστικά στο σπίτι

Τech & Science / Αλτσχάιμερ: Εγκρίθηκε θεραπεία που μπορεί να χορηγηθεί στο σπίτι από τον ίδιο τον ασθενή

Η έκδοση για χρήση στο σπίτι εγκρίθηκε ως θεραπεία συντήρησης που οι ασθενείς μπορούν να χορηγούν στον εαυτό τους αφού ολοκληρώσουν τον κύκλο της ενδοφλέβιας θεραπείας
LIFO NEWSROOM
«Νέα γενιά εθισμένων»: Τι κινδύνους κρύβει το άτμισμα για τον εγκέφαλο των εφήβων

Τech & Science / «Νέα γενιά εθισμένων»: Τι κινδύνους κρύβει το άτμισμα για τον εγκέφαλο των εφήβων

Οι ειδικοί προειδοποιούν ότι τα ηλεκτρονικά τσιγάρα δημιουργούν νέους εθισμούς στη νικοτίνη και προκαλούν σοβαρούς κινδύνους για την καρδιά, τους πνεύμονες και τον εγκέφαλο των παιδιών και των εφήβων
LIFO NEWSROOM
«Είναι κάπως σαν νίκη για τη Google»: Πώς κατάφερε να γλιτώσει από το να πουλήσει το Chrome

Τech & Science / «Είναι κάπως σαν νίκη για τη Google»: Πώς κατάφερε να γλιτώσει από το να πουλήσει το Chrome

Η απόφαση αυτή θεωρείται μια από τις σημαντικότερες των τελευταίων 20 ετών - Η Google διατηρεί πάντως κάποιες «ανησυχίες» για την υποχρέωσή της να μοιράζεται δεδομένα διαδικτυακών αναζητήσεων
LIFO NEWSROOM
Το James Webb εντόπισε «γυμνή» μαύρη τρύπα από την αυγή του σύμπαντος - «Μία πραγματική ια πρόκληση για τις θεωρίες μας»

Τech & Science / Το James Webb εντόπισε «γυμνή» μαύρη τρύπα από την αυγή του σύμπαντος - «Μία πραγματική πρόκληση για τις θεωρίες μας»

Οι αστρονόμοι εκτιμούν ότι ίσως ανήκει σε μία κατηγορία αντικειμένων που είχε θεωρητικά προβλέψει ο Στίβεν Χόκινγκ, αλλά που μέχρι σήμερα δεν είχε ποτέ εντοπιστεί
LIFO NEWSROOM
Τι είναι το Clanker και γιατί το χρησιμοποιούν οι χρήστες του διαδικτύου ως αντι-AI αργκό;

Τech & Science / Τι είναι το Clanker και γιατί το χρησιμοποιούν οι χρήστες του διαδικτύου ως αντι-AI αργκό;

Ο όρος διαδίδεται στα social media μεταξύ των ανθρώπων που δηλώνουν «κουρασμένοι» με την τεχνητή νοημοσύνη που «εφευρίσκει» πράγματα, ακούγεται υπερβολικά ανθρώπινη και απειλεί να εξαφανίσει θέσεις εργασίας
LIFO NEWSROOM