Το νέο μοντέλο τεχνητής νοημοσύνης της Google δημιουργεί ψηφιακούς κόσμους σε πραγματικό χρόνο

Το νέο μοντέλο τεχνητής νοημοσύνης της Google δημιουργεί ψηφιακούς κόσμους σε πραγματικό χρόνο Facebook Twitter
Φωτ. Αρχείου: Getty Images
0

Η Google παρουσίασε το Genie 3, το νέο μοντέλο τεχνητής νοημοσύνης της DeepMind, ικανό να δημιουργεί τρισδιάστατους ψηφιακούς κόσμους σε πραγματικό χρόνο, στους οποίους μπορούν να αλληλεπιδρούν τόσο χρήστες όσο και ψηφιακοί πράκτορες.

Πρόκειται για σημαντική εξέλιξη στον τομέα των “world models”, δηλαδή των συστημάτων τεχνητής νοημοσύνης που προσομοιώνουν εικονικά περιβάλλοντα για χρήση σε εκπαίδευση, ψυχαγωγία ή εκμάθηση ρομπότ. Οι κόσμοι αυτοί δεν βασίζονται σε προγραμματισμένες τρισδιάστατες υφές, αλλά δημιουργούνται εξ ολοκλήρου μέσω τεχνητής νοημοσύνης, βάσει απλών προτροπών (prompts) από τον χρήστη.

Το Genie 3 ξεπερνά σημαντικούς περιορισμούς των προηγούμενων εκδόσεων, όπως το Genie 2, το οποίο μπορούσε να δημιουργήσει μόνο σύντομες διαδραστικές εμπειρίες διάρκειας μερικών δευτερολέπτων. Πλέον, ο χρήστης μπορεί να παραμείνει μέσα στον παραγόμενο κόσμο για λίγα λεπτά, ενώ η μηχανή διαθέτει οπτική μνήμη διάρκειας περίπου ενός λεπτού. Αυτό σημαίνει πως αν κοιτάξεις μακριά από έναν τοίχο με σχέδια ή έναν πίνακα με γραμμένο κείμενο, τα στοιχεία αυτά θα παραμείνουν στη θέση τους όταν στρέψεις ξανά το βλέμμα προς αυτά.

Οι κόσμοι του Genie 3 αποδίδονται σε ανάλυση 720p και ρυθμό 24 καρέ ανά δευτερόλεπτο, προσφέροντας μια εμπειρία πιο κοντά σε περιβάλλον βιντεοπαιχνιδιού.

Μια ακόμα καινοτομία του Genie 3 είναι η δυνατότητα “promptable world events”: οι χρήστες μπορούν να μεταβάλουν, με απλές εντολές, στοιχεία του περιβάλλοντος όπως οι καιρικές συνθήκες ή να προσθέσουν νέους χαρακτήρες στον κόσμο.

Η DeepMind είχε παρουσιάσει τον Δεκέμβριο του 2024 το Genie 2, το οποίο μπορούσε να δημιουργεί διαδραστικούς κόσμους βασισμένους σε μία μόνο εικόνα. Η νέα ομάδα ανάπτυξης “world models” περιλαμβάνει, μάλιστα, πρώην συν-επικεφαλής του εργαλείου παραγωγής βίντεο Sora της OpenAI.

Περιορισμένη δοκιμή — Όχι (ακόμα) διαθέσιμο για το κοινό

Παρά τις τεχνικές εξελίξεις, το Genie 3 δεν είναι προς το παρόν διαθέσιμο στο ευρύ κοινό. Η Google το διαθέτει αποκλειστικά ως «περιορισμένο ερευνητικό δείγμα» σε μια μικρή ομάδα ακαδημαϊκών και δημιουργών, προκειμένου να μελετήσει τους πιθανούς κινδύνους και τρόπους αντιμετώπισής τους.

Υπάρχουν, επίσης, πολλοί περιορισμοί στη χρήση: το είδος της αλληλεπίδρασης παραμένει περιορισμένο, ενώ κατανοητό κείμενο μέσα στους κόσμους μπορεί να δημιουργηθεί μόνο αν έχει συμπεριληφθεί στην αρχική προτροπή. Η Google αναφέρει πως εξετάζει το ενδεχόμενο να διευρύνει την πρόσβαση στο εργαλείο σε περισσότερους δοκιμαστές στο μέλλον.

Με πληροφορίες από The Verge


 

Τech & Science
0

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Θέλει να γίνει το Android των ανθρωποειδών ρομπότ: H OpenMind υπόσχεται επανάσταση στη συμβίωση ανθρώπου–μηχανής

Τech & Science / Θέλει να γίνει το Android των ανθρωποειδών ρομπότ: H OpenMind υπόσχεται επανάσταση στη συμβίωση ανθρώπου–μηχανής

Με λογισμικό ανοικτού κώδικα που επιτρέπει στα ρομπότ να επικοινωνούν, να μαθαίνουν και να συνυπάρχουν, η νεοφυής εταιρεία από τη Silicon Valley φιλοδοξεί να γίνει το λειτουργικό σύστημα των ανθρωποειδών ρομπότ της επόμενης εποχής.
LIFO NEWSROOM
Aeneas: Η Google και ο Έλληνας Γιάννης Ασσαέλ δίνουν νέα ζωή στις ρωμαϊκές επιγραφές με εργαλείο AI

Τech & Science / Aeneas: Η Google και ο Έλληνας Γιάννης Ασσαέλ δίνουν νέα ζωή στις ρωμαϊκές επιγραφές με εργαλείο AI

Το σύστημα, που ονομάζεται Aeneas από τον μυθικό Τρωικό ήρωα, βοηθά τους ιστορικούς να ερμηνεύσουν, να αποδώσουν και να αποκαταστήσουν αρχαίες ρωμαϊκές επιγραφές
LIFO NEWSROOM

ΔΕΙΤΕ ΑΚΟΜΑ

Θέλει να γίνει το Android των ανθρωποειδών ρομπότ: H OpenMind υπόσχεται επανάσταση στη συμβίωση ανθρώπου–μηχανής

Τech & Science / Θέλει να γίνει το Android των ανθρωποειδών ρομπότ: H OpenMind υπόσχεται επανάσταση στη συμβίωση ανθρώπου–μηχανής

Με λογισμικό ανοικτού κώδικα που επιτρέπει στα ρομπότ να επικοινωνούν, να μαθαίνουν και να συνυπάρχουν, η νεοφυής εταιρεία από τη Silicon Valley φιλοδοξεί να γίνει το λειτουργικό σύστημα των ανθρωποειδών ρομπότ της επόμενης εποχής.
LIFO NEWSROOM
Μούμια με τατουάζ

Τech & Science / Τα τατουάζ στα χέρια μιας μούμιας, ηλικίας 2.300 ετών, αποκαλύπτουν νέες πληροφορίες για την τεχνική τους στην αρχαία Σιβηρία

Οι αρχαιολόγοι ανακάλυψαν ότι τα τατουάζ της μουμιοποιημένης γυναίκας, που απεικονίζουν φανταστικά ζώα, δημιουργήθηκαν με άγνωστα εργαλεία, πιθανώς από βιοδιασπώμενα υλικά
LIFO NEWSROOM
Καρκίνος: Ξένοι ερευνητές με επικεφαλής Έλληνα καθηγητή ανέπτυξαν καινοτόμο μέθοδο για διάγνωση και θεραπεία

Τech & Science / Καρκίνος: Ξένοι ερευνητές με επικεφαλής Έλληνα καθηγητή ανέπτυξαν καινοτόμο μέθοδο για διάγνωση και θεραπεία

«Τα ευρήματα αυτής της έρευνας θα μπορούσαν να αποτελέσουν σημαντική εξέλιξη στη διάγνωση, την πρόγνωση και τη θεραπεία του καρκίνου», δήλωσε ο Κώστας Αρβανίτης
LIFO NEWSROOM
Πώς η κλιματική κρίση απειλεί τον εγκέφαλο: Οι επιπτώσεις της ζέστης σε νευρολογικές παθήσεις

Τech & Science / Πώς η κλιματική κρίση απειλεί τον εγκέφαλο: Οι επιπτώσεις της ζέστης σε νευρολογικές παθήσεις

Η ακραία ζέστη λόγω της κλιματικής αλλαγής επιδεινώνει νευρολογικές παθήσεις όπως η επιληψία, η άνοια και τα εγκεφαλικά - Τι αποκαλύπτουν επιστήμονες για τον «καυτό εγκέφαλο» και τις νέες προκλήσεις που έρχονται
LIFO NEWSROOM
Καινοτόμος ανοσοθεραπεία κατά του καρκίνου του πνεύμονα, με ελληνική σφραγίδα

Τech & Science / Καινοτόμος ανοσοθεραπεία κατά του καρκίνου του πνεύμονα, με ελληνική σφραγίδα

Τα ευρήματα ανοίγουν νέους θεραπευτικούς δρόμους απέναντι στον μικροκυτταρικό καρκίνο που αποτελεί μια επιθετική μορφή καρκίνου του πνεύμονα, η οποία ευθύνεται για το 15-20% των νέων διαγνώσεων στη χώρα μας και παγκόσμια
LIFO NEWSROOM