Τεχνητή νοημοσύνη «διαβάζει» τα χείλη καλύτερα από τους ανθρώπους

Από τους ερευνητές της Google και της Deep Mind, με επικεφαλής έναν νεαρό ελληνικής καταγωγής

LifO Newsroom 1.8.2018 | 10:28

1.8.2018 | 10:28

Ερευνητές της Google και της βρετανικής θυγατρικής της Deep Mind, ανέπτυξαν ένα νέο πρόγραμμα τεχνητής νοημοσύνης που «διαβάζει» τα χείλη των ανθρώπων εξ αποστάσεως με μεγαλύτερη ακρίβεια όχι μόνο από κάθε άλλο μέχρι σήμερα, αλλά και από τους ανθρώπους με τη σχετική εξειδίκευση.

Επικεφαλής του προγράμματος είναι ένας νεαρός ελληνικής καταγωγής, ειδικός της πληροφορικής, ο Γιάννης Ασσαέλ.

Για τα εκατομμύρια των ανθρώπων που δεν μπορούν να ακούσουν, η ανάγνωση των χειλιών των άλλων αποτελεί ένα «παράθυρο» για την επικοινωνία, πέρα από τη νοηματική γλώσσα. Όμως το «διάβασμα» των χειλιών δεν είναι εύκολο και συχνά είναι ανακριβές.

Το νέο «έξυπνο» σύστημα εμφανίζει μέσο ποσοστό λαθών 41% στην ορθή κατανόηση των λέξεων που σχηματίζουν τα χείλη. Μπορεί να φαίνεται υψηλό αυτό το ποσοστό, αλλά η καλύτερη μέχρι σήμερα υπολογιστική μέθοδος είχε ποσοστό αποτυχίας 77%, συνεπώς το νέο πρόγραμμα έχει περιορίσει σχεδόν στο μισό τα λάθη.

Οι ερευνητές, με επικεφαλής τον Ασσαέλ και τον Μπρένταν Σίλινγκφορντ, οι οποίοι έκαναν τη σχετική προδημοσίευση στο arXiv, σύμφωνα με το «Science», δημιούργησαν αλγόριθμους καλύτερους από κάθε άλλους στο παρελθόν, που τα καταφέρνουν αποτελεσματικότερα και από επαγγελματίες αναγνώστες χειλιών.

Αν το νέο σύστημα τελειοποιηθεί και ενσωματωθεί σε ηλεκτρονικές συσκευές, όπως τα «έξυπνα» κινητά τηλέφωνα, μπορεί μελλοντικά να προσφέρει τη δυνατότητα ανάγνωσης των χειλιών στον καθένα.

Η δημιουργία αλγορίθμων που να μπορούν να διαβάσουν χείλη ήταν έως τώρα τρομερά δύσκολη.

Οι ερευνητές τροφοδότησαν το σύστημά τους με 140.000 ώρες βίντεο από το You Tube που έδειχναν ανθρώπους να μιλάνε στα αγγλικά, μαζί με τα αντίστοιχα απομαγνητοφωνημένα κείμενα.

Στη συνέχεια, άφησαν το σύστημα μηχανικής μάθησης μόνο του να μάθει να «παντρεύει» τις διαφορετικές κινήσεις των χειλιών με τα αντίστοιχα φωνήματα και τελικά με τις αντίστοιχες λέξεις.

Το σύστημα βασίζεται στα τεχνητά νευρωνικά δίκτυα, δηλαδή σε μια ομάδα αλγόριθμων που ο καθένας εκτελεί ένα διαφορετικό και απλούστερο έργο, ενώ ταυτόχρονα όλοι μαζί συνδέονται και συνεργάζονται για να επεξεργασθούν τις πληροφορίες, περίπου όπως κάνουν οι νευρώνες του ανθρώπινου εγκεφάλου.

Αφού το σύστημα «αυτο-εκπαιδεύθηκε», δοκιμάσθηκε από τους ερευνητές στην ανάγνωση των χειλιών των ανθρώπων ενός 37λεπτου βίντεο, που ποτέ πριν το σύστημα δεν είχε «δει».

Το πρόγραμμα έσφαλε στο 41% των λέξεων, αλλά οι άνθρωποι -ακόμη και οι ειδικοί στο διάβασμα του στόματος- που είδαν το ίδιο βίντεο, είχαν μέσο ποσοστό αποτυχίας 93% (πάντως σε πραγματικές συνθήκες και όχι παρακολούθησης βίντεο, το ποσοστό ανθρώπινης αποτυχίας είναι κάπως μικρότερο, καθώς ο ανθρώπινος εγκέφαλος μπορεί να αξιοποιήσει και άλλα στοιχεία, όπως η γλώσσα του σώματος αυτού που μιλάει).

Σε κάθε περίπτωση, αν και συνιστά πραγματική πρόοδο, είναι σαφές ότι ένα ποσοστό αποτυχίας της τάξης του 40% στην αναγνώριση των λέξεων σημαίνει ότι το σύστημα χρειάζεται ακόμη ουσιαστική βελτίωση.

Όταν αυτή υπάρξει, το σύστημα μπορεί να αξιοποιηθεί ευρύτερα και στην καθημερινότητα. Για παράδειγμα, όταν θα βλέπουμε στην τηλεόραση έναν ποδοσφαιριστή να βρίζει ένα διαιτητή ή έναν αντίπαλο παίκτη, αλλά φυσικά δεν ακούμε τι λέει, θα ξέρουμε πια τι είπε!

Ο Γιάννης Ασσαέλ υπήρξε μαθητής του Κολεγίου Ανατόλια της Θεσσαλονίκης και σπούδασε εφαρμοσμένη πληροφορική στο Πανεπιστήμιο Μακεδονίας (2008-2013).

Στη συνέχεια, έκανε μεταπτυχιακά (μάστερ) στην επιστήμη των υπολογιστών στο Πανεπιστήμιο της Οξφόρδης, όπου σήμερα ολοκληρώνει το διδακτορικό του πάνω στη μηχανική μάθηση, ενώ παράλληλα εργάζεται για τη Deep Mind της Google.

Με πληροφορίες από ΑΠΕ-ΜΠΕ

Τech & Science

ΔΕΙΤΕ ΑΚΟΜΑ

Τech & Science / Οι μέλισσες «ζορίζονται» περισσότερο απ’ όσο νομίζουμε όταν πετάνε και συλλέγουν γύρη

Νέα έρευνα αποκαλύπτει ότι οι μέλισσες εξαντλούνται τόσο στην απογείωση όσο και στη συλλογή της γύρης

Τεχνητή νοημοσύνη «διαβάζει» τα χείλη καλύτερα από τους ανθρώπους

Tags

ΕΓΓΡΑΦΕΙΤΕ ΣΤΟ NEWSLETTER ΜΑΣ

ΔΙΑΒΑΖΟΝΤΑΙ ΤΩΡΑ

Το απλό κόλπο που μπορεί να σταματήσει τον κνησμό από το τσίμπημα κουνουπιού

Κότσιρας: «Ήθελα αν τύχει και με ακούσει ο Ξαρχάκος, ο Θεοδωράκης, να νιώσουν ότι προστατεύω το έργο τους»

Final 4 Euroleague 2026: O Ολυμπιακός στην κορυφή της Ευρώπης για τέταρτη φορά στην ιστορία του

Δολοφονία στη Θεσσαλονίκη: Τι βρέθηκε στο σπίτι του 67χρονου - Η ανακοίνωση της ΕΛΑΣ

Στέιτ Ντιπάρτμεντ: «Ο Αλέξανδρος Γιωτόπουλος είναι καταδικασμένος δολοφόνος και τρομοκράτης»

Κίνα: Σε τροχιά η διαστημική αποστολή Shenzhou-23 - Στόχος να φτάσουν αστροναύτες στη Σελήνη πριν το 2030

ΔΕΙΤΕ ΑΚΟΜΑ

Τech & Science / Οι μέλισσες «ζορίζονται» περισσότερο απ’ όσο νομίζουμε όταν πετάνε και συλλέγουν γύρη

Τech & Science / Το αντισεισμικό επίτευγμα της Μεγάλης Πυραμίδας της Γκίζας: Τι αποκαλύπτει νέα μελέτη

Τech & Science / Οι επιστήμονες εντόπισαν τα απομεινάρια γαλαξία που «κατάπιε» ο Γαλαξίας μας

Τech & Science / Κίνα: Σε τροχιά η διαστημική αποστολή Shenzhou-23 - Στόχος να φτάσουν αστροναύτες στη Σελήνη πριν το 2030

Τech & Science / Αυστραλία: Φυτό που θεωρούνταν εξαφανισμένο εδώ και 60 χρόνια βρέθηκε ξανά τυχαία

Τech & Science / Γιατί οι κινεζικές εταιρείες AI προηγούνται στη δημιουργία βίντεο

Τech & Science / Νέα μελέτη συνδέει κοινά συντηρητικά τροφίμων με αυξημένο κίνδυνο υπέρτασης και εμφράγματος

Τech & Science / Η Meta περιόρισε λογαριασμούς επικριτών της Σαουδικής Αραβίας μετά από αιτήματα των αρχών

Τech & Science / Μαλαισία: Νέοι κανόνες για την προστασία των νέων στα social media

Τech & Science / Καρκίνος του δέρματος: 5 τρόποι για προστασία από τον ήλιο

Τech & Science / Έρευνα Stanford: Τα AI chatbots αποκτούν «συνδικαλιστικές τάσεις» όταν δουλεύουν υπερβολικά

Τech & Science / Ο Άρης όπως δεν τον έχουμε ξαναδεί: Οι νέες εικόνες της NASA

Τech & Science / Politico: Το Πεντάγωνο θέλει να αξιοποιήσει και να «οπλίσει» νέα AI μοντέλα κυβερνοπολέμου

Τech & Science / Ο εγκέφαλος του 21ου αιώνα: Η νευροεπιστήμη εξηγεί ποιες δεξιότητες θα έχουν μεγαλύτερη αξία στο μέλλον

Τech & Science / Spotify: Θα δίνει εισιτήρια συναυλιών; - Η νέα λειτουργία που ετοιμάζει η πλατφόρμα

Τech & Science / Η απροσδόκητη παρενέργεια των φαρμάκων για την απώλεια βάρους: Ανάσχεση του καρκίνου

Τech & Science / Η Ιαπωνία δοκιμάζει θεραπεία με anime για την αντιμετώπιση της κατάθλιψης

Τech & Science / Η αρχή του σεξ ήταν ένα θαλάσσιο πλάσμα ηλικίας 567 εκατ. ετών

Τech & Science / Η διακοπή αυτής της κακής συνήθειας ίσως συνδέεται με μειωμένο κίνδυνο εμφάνισης άνοιας

Τech & Science / Ενώσεις καταναλωτών καταγγέλλουν Meta, TikTok, Google - Ο λόγος

σχόλια