Εφαρμογή τεχνητής νοημοσύνης αναγνωρίζει και ψηφιοποιεί ιστορικά βιβλία γραμμένα σε πολυτονικό

Εφαρμογή τεχνητής νοημοσύνης αναγνωρίζει και ψηφιοποιεί ιστορικά βιβλία γραμμένα σε πολυτονικό Facebook Twitter
Φωτ: Εργαστήριο Υπολογιστικής Ευφυΐας του Δημόκριτου / ΑΠΕ
0

Μία εφαρμογή τεχνητής νοημοσύνης που αναγνωρίζει και ψηφιοποιεί ιστορικά βιβλία γραμμένα σε πολυτονικό ανέπτυξε η ομάδα Ψηφιακής Επεξεργασίας Εγγράφων του Εργαστηρίου Υπολογιστικής Ευφυίας του Εθνικού Κέντρου Έρευνας Φυσικών Επιστημών «Δημόκριτος».

Η εφαρμογή παρουσιάζεται στο «Athens Science Festival», που φιλοξενείται μέχρι αύριο Κυριακή 21 Απριλίου στην Τεχνόπολη του δήμου Αθηναίων.

Η πλατφόρμα αναπτύχθηκε στο πλαίσιο του έργου «reBook», που υλοποιείται σε συνεργασία με τον Σύλλογο Προς Διάδοσιν Ωφελίμων Βιβλίων (ΣΩΒ) και την εταιρεία Innews, στο πλαίσιο του ΕΣΠΑ 2014-2020. Στόχος του έργου είναι η ανάπτυξη νέων τεχνικών και μεθοδολογιών αναγνώρισης κειμένων, κυρίως γραμμένων σε πολυτονικό σύστημα, για την επιστημονική τεκμηρίωση της πολιτιστικής κληρονομιάς.

Με τη βοήθεια της εφαρμογής ερευνητές του Δημόκριτου ψηφιοποιούν και επανεκδίδουν ψηφιακά, περίπου 100 βιβλία από τα αρχεία του ΣΩΒ, τα οποία χρονολογούνται από τις αρχές του 20ου αιώνα και μετά. Ανάμεσα σε αυτά βρίσκονται το σύγγραμμα του Αδαμάντιου Κοραή «Επιστολαί προς τον Πρωτοψάλτην», που εκδόθηκε το 1911 και επανεκδόθηκε το 1959. Επίσης, το βιβλίο «Η ελληνικότης των νομών Προύσης και Σμύρνης» του Παντελή Κοντογιάννη, που πρωτοεκδόθηκε το 1919.

Στην εφαρμογή ανεβαίνουν εικόνες σκαναρισμένων βιβλίων και στη συνέχεια με τη βοήθεια της τεχνητής νοημοσύνης αναγνωρίζεται το κείμενο της κάθε εικόνας, ακόμα και αν είναι γραμμένο σε πολυτονικό σύστημα. Επίσης, στο στάδιο της προεπεξεργασίας της κάθε εικόνας, η εφαρμογή διορθώνει τα προβλήματα που μπορεί να έχει η εικόνα του βιβλίου, από το στραβό σκανάρισμα μέχρι τη διόρθωση ξεθωριασμένων σελίδων.

Εφαρμογή τεχνητής νοημοσύνης αναγνωρίζει και ψηφιοποιεί ιστορικά βιβλία γραμμένα σε πολυτονικό Facebook Twitter
Φωτ: Εργαστήριο Υπολογιστικής Ευφυΐας του Δημόκριτου / ΑΠΕ

«Ο στόχος μας είναι ιστορικά βιβλία να φτάσουν στο ευρύ κοινό και τους ερευνητές»

«Υπάρχει ένας τεράστιος όγκος βιβλίων που δεν είναι διαθέσιμα ψηφιακά και θέλουμε να τα κάνουμε διαθέσιμα, να βγάλουμε στην επιφάνεια τεκμήρια, τα οποία είναι στα ντουλάπια και τα ράφια βιβλιοθηκών. Οπότε ο στόχος μας είναι ιστορικά βιβλία να φτάσουν στο ευρύ κοινό και τους ερευνητές», εξηγεί στο ΑΠΕ-ΜΠΕ η Κατερίνα Χριστοπούλου, υποψήφια διδάκτορας Οικολογίας Τοπίου και επιστημονική συνεργάτιδα του «Δημόκριτου».

Εξηγώντας την αξία της εφαρμογής η κ. Χριστοπούλου επισημαίνει ότι «δεν βλέπουμε απλά ένα pdf με την εικόνα της σελίδας, αλλά η εικόνα έχει από πίσω την οπτική αναγνώριση χαρακτήρων (OCR), οπότε ο αναγνώστης μπορεί να χρησιμοποιήσει τμήματα του αρχείου ή να κάνει αναζήτηση μέσα σε αυτό». Η μεγάλη διαφορά όμως της εφαρμογής έγκειται «στην ανάγνωση του πολυτονικού συστήματος».

Δεν είναι η πρώτη φορά που το Εργαστήριο Υπολογιστικής Ευφυΐας του Ινστιτούτου Πληροφορικής και Τηλεπικοινωνιών του Δημόκριτου ασχολείται με την επεξεργασία και αναγνώριση ιστορικών εγγράφων. Σε αντίστοιχο έργο που υλοποίησε σε συνεργασία με το Πανεπιστήμιο Κύπρου προχώρησε στην ψηφιοποίηση με την ίδια μέθοδο πολυτονικών κειμένων από περίπου 150 εκδόσεις έργων του Σέξπιρ στα ελληνικά. Πρόκειται για μεταφράσεις που υπέγραψαν σπουδαίοι λογοτέχνες, όπως ο Κωνσταντίνος Καβάφης, ο Κωνσταντίνος Θεοτόκης και ο Δημήτριος Βικέλας, και οι οποίες προέρχονται μεταξύ άλλων από τις συλλογές της Βιβλιοθήκης της Βουλής, της Εθνικής Βιβλιοθήκης και του Ελληνικού Λογοτεχνικού και Ιστορικού Αρχείου.

«Η αναγνώριση χειρογράφων στα σύγχρονα κείμενα έχει προχωρήσει πολύ»

Ένα από τα στοιχήματα που έχει βάλει το Εργαστήριο είναι η ψηφιακή απεικόνιση χειρογράφων. «Η αναγνώριση χειρογράφων στα σύγχρονα κείμενα έχει προχωρήσει πολύ. Αυτό που δεν είχε γίνει στο παρελθόν είναι κάποιο εργαλείο που να μπορεί να αναγνωρίσει τα παλιά χειρόγραφα και ιδίως τα ελληνικά πολυτονικά», εξηγεί στο ΑΠΕ-ΜΠΕ ο υπεύθυνος του Εργαστηρίου, Βασίλης Γάτος.

Αυτή την περίοδο βρίσκεται σε εξέλιξη έργο σε συνεργασία με την Τράπεζα της Ελλάδας για την αναγνώριση και επεξεργασία, και πάλι με τη βοήθεια τεχνητής νοημοσύνης, των χειρόγραφων πρακτικών του ΔΣ της Τράπεζας της περιόδου 1928-1988. Το αρχείο αριθμεί περίπου 30.000 σελίδες. «Είναι πολύ δύσκολο το πρόβλημα των χειρογράφων, αλλά κάτι που μας βοηθάει σε αυτή την περίπτωση είναι ότι οι γραφείς είναι συγκεκριμένοι όλα αυτά τα χρόνια, οπότε για κάθε γραφέα έχουμε χιλιάδες σελίδες και αυτό μας βοηθάει στο θέμα της εκπαίδευσης του συστήματος», τονίζει ο κ. Γάτος.

Σε παλιότερο έργο της, η ομάδα συνεργάστηκε με το Ίδρυμα της Μονής του Όρους Σινά με σκοπό την ανάπτυξη τεχνολογιών για αναζήτηση πληροφορίας απευθείας από τις εικόνες των χειρογράφων της Μονής. Στο πλαίσιο του έργου αναλύθηκαν και αναγνωρίστηκαν περισσότερες από 100.000 σελίδες ιστορικών χειρογράφων.

Σημειώνεται ότι στο «Athens Science Festival» θα παρουσιαστεί η δουλειά μιας ακόμα ερευνητικής ομάδας του ίδιου Εργαστηρίου του Δημόκριτου. Η ομάδα «AI4GEO» θα εξηγήσει πώς η παρατήρηση της Γης μέσω εφαρμογών τεχνητής νοημοσύνης «μεταμορφώνεται» σε ένα γιγάντιο άγρυπνο μάτι που μας βοηθά να ανακαλύψουμε πετρώματα και κοιτάσματα, να καταγράψουμε φυσικές καταστροφές ή να παρακολουθήσουμε τις εξελισσόμενες ανθρωπιστικές κρίσεις.

Τech & Science
0

ΔΕΙΤΕ ΑΚΟΜΑ

Το YouTube λέει στους διαφημιστές: «Εμείς είμαστε η νέα τηλεόραση»

TV & Media / «Εμείς είμαστε η νέα τηλεόραση» λέει το YouTube

Στο φετινό Brandcast, το YouTube παρουσίασε νέες σειρές με τον Τρέβορ Νόα, την Άλεξ Κούπερ, τον Καρίμ Ράχμα, τον Ντουέιν Γουέιντ και μερικούς από τους πιο αναγνωρίσιμους δημιουργούς του διαδικτύου. Το μήνυμα ήταν σαφές: αυτό που κάποτε λέγαμε "βλέπω YouTube" αρχίζει να μοιάζει όλο και περισσότερο με κανονικό τηλεοπτικό πρόγραμμα, μόνο που δεν περνά πια από τα παραδοσιακά κανάλια.
THE LIFO TEAM
Ο Πίτερ Τζάκσον στις Κάννες: «Η τεχνητή νοημοσύνη είναι απλώς ένα ειδικό εφέ»

Τech & Science / Ο Πίτερ Τζάκσον στις Κάννες: «Η τεχνητή νοημοσύνη είναι απλώς ένα ειδικό εφέ»

Μετά τον τιμητικό Χρυσό Φοίνικα, ο σκηνοθέτης του Άρχοντα των Δαχτυλιδιών μίλησε για την AI, τα δικαιώματα των ηθοποιών, τον Γκόλουμ του Άντι Σέρκις και το νέο The Hunt for Gollum. ΚΕΙΜΕΝΟ
THE LIFO TEAM
ΕΓΚΕΦΑΛΟΣ ΓΗΡΑΝΣΗ

Τech & Science / Τρεις απολαυστικοί τρόποι να επιβραδύνετε τη γήρανση του εγκεφάλου σας

Ο ανθρώπινος εγκέφαλος «ακμάζει» μέσα από διάφορες προκλήσεις, αλλά δεν χρειάζεται να κάνετε πάντα σκληρή δουλειά για να αποκομίσετε τα οφέλη για την υγεία - Ακολουθούν τρεις απλοί και διασκεδαστικοί τρόποι για να προστατεύσετε τον εγκέφαλό σας καθώς μεγαλώνετε
THE LIFO TEAM
Cate Blanchett, George Clooney και Meryl Streep στηρίζουν νέο σύστημα συναίνεσης για την AI

Τech & Science / Η Κέιτ Μπλάνσετ, ο Τζορτζ Κλούνεϊ και η Μέριλ Στριπ στηρίζουν νέο σύστημα συναίνεσης για την AI

Η Κέιτ Μπλάνσετ συνιδρύει το RSL Media, έναν μη κερδοσκοπικό οργανισμό που θέλει να δώσει σε δημιουργούς και απλούς χρήστες έναν τρόπο να δηλώνουν αν επιτρέπουν ή απαγορεύουν τη χρήση της εικόνας, της φωνής και των έργων τους από συστήματα τεχνητής νοημοσύνης.
THE LIFO TEAM
Το ChatGPT στην Κίνα υπόσχεται να «σε κρατήσει με ασφάλεια» και έγινε meme

Τech & Science / Το ChatGPT στην Κίνα υπόσχεται να «σε κρατήσει με ασφάλεια» και έγινε meme

Στα αγγλικά το ChatGPT έχει τις παύλες, τα έτοιμα σχήματα και τις φράσεις που μυρίζουν AI από μακριά. Στα κινεζικά, οι χρήστες το κοροϊδεύουν επειδή επαναλαμβάνει μια παράξενα τρυφερή φράση, σαν να είναι έτοιμο να τους πιάσει αν πέσουν.
THE LIFO TEAM
Πώς γίνεσαι tech bro: Το Στάνφορντ ως εργοστάσιο των νέων δισεκατομμυριούχων

Τech & Science / Πώς γίνεσαι tech bro: Το Στάνφορντ ως εργοστάσιο εικοσάρηδων δισεκατομμυριούχων

Στο How to Rule the World, ο 21χρονος δημοσιογράφος Θίο Μπέικερ μπαίνει στον κλειστό κόσμο του Στάνφορντ, εκεί όπου επενδυτές, hackathons και ελίτ φοιτητικές λέσχες μαθαίνουν σε παιδιά είκοσι ετών να σκέφτονται σαν μελλοντικοί άρχοντες της Σίλικον Βάλεϊ. Το πιο παράλογο; Μερικοί παίρνουν χρηματοδότηση πριν σκεφτούν καν τι εταιρεία θέλουν να φτιάξουν.
THE LIFO TEAM
Η νέα βιτρίνα της μόδας βρίσκεται πια κάτω από το πόστ σου

Τech & Science / Η νέα βιτρίνα της μόδας βρίσκεται πια κάτω από το πόστ σου

Οι μάρκες μόδας και ομορφιάς δεν αρκούνται πια στο τέλειο post. Μπαίνουν όλο και πιο ενεργά στα σχόλια του Instagram και του TikTok, εκεί όπου η Gen Z ψάχνει προϊόντα, συγκρίνει γνώμες και αποφασίζει τι μπορεί να εμπιστευτεί. Το πιο υποτιμημένο σημείο των social media γίνεται η νέα βιτρίνα τους.
THE LIFO TEAM
Το SheerLuxe έφτιαξε AI influencers και οι αναγνώστριες δεν το συγχώρεσαν

Τech & Science / Το SheerLuxe έφτιαξε AI influencers και οι αναγνώστριες δεν το συγχώρεσαν

Η βρετανική πλατφόρμα μόδας και lifestyle παρουσίασε τέσσερις ψηφιακές influencers για συμβουλές ομορφιάς και styling στο Instagram, προκαλώντας έντονες αντιδράσεις. Οι αναγνώστριες κατηγόρησαν το SheerLuxe ότι προωθεί μη ρεαλιστικά πρότυπα ομορφιάς και αντικαθιστά πραγματικές γυναίκες με avatars που δεν μπορούν καν να δοκιμάσουν τα προϊόντα που προτείνουν.
THE LIFO TEAM