Το νέο μοντέλο τεχνητής νοημοσύνης της Google δημιουργεί ψηφιακούς κόσμους σε πραγματικό χρόνο

Το νέο μοντέλο τεχνητής νοημοσύνης της Google δημιουργεί ψηφιακούς κόσμους σε πραγματικό χρόνο Facebook Twitter
Φωτ. Αρχείου: Getty Images
0

Η Google παρουσίασε το Genie 3, το νέο μοντέλο τεχνητής νοημοσύνης της DeepMind, ικανό να δημιουργεί τρισδιάστατους ψηφιακούς κόσμους σε πραγματικό χρόνο, στους οποίους μπορούν να αλληλεπιδρούν τόσο χρήστες όσο και ψηφιακοί πράκτορες.

Πρόκειται για σημαντική εξέλιξη στον τομέα των “world models”, δηλαδή των συστημάτων τεχνητής νοημοσύνης που προσομοιώνουν εικονικά περιβάλλοντα για χρήση σε εκπαίδευση, ψυχαγωγία ή εκμάθηση ρομπότ. Οι κόσμοι αυτοί δεν βασίζονται σε προγραμματισμένες τρισδιάστατες υφές, αλλά δημιουργούνται εξ ολοκλήρου μέσω τεχνητής νοημοσύνης, βάσει απλών προτροπών (prompts) από τον χρήστη.

Το Genie 3 ξεπερνά σημαντικούς περιορισμούς των προηγούμενων εκδόσεων, όπως το Genie 2, το οποίο μπορούσε να δημιουργήσει μόνο σύντομες διαδραστικές εμπειρίες διάρκειας μερικών δευτερολέπτων. Πλέον, ο χρήστης μπορεί να παραμείνει μέσα στον παραγόμενο κόσμο για λίγα λεπτά, ενώ η μηχανή διαθέτει οπτική μνήμη διάρκειας περίπου ενός λεπτού. Αυτό σημαίνει πως αν κοιτάξεις μακριά από έναν τοίχο με σχέδια ή έναν πίνακα με γραμμένο κείμενο, τα στοιχεία αυτά θα παραμείνουν στη θέση τους όταν στρέψεις ξανά το βλέμμα προς αυτά.

Οι κόσμοι του Genie 3 αποδίδονται σε ανάλυση 720p και ρυθμό 24 καρέ ανά δευτερόλεπτο, προσφέροντας μια εμπειρία πιο κοντά σε περιβάλλον βιντεοπαιχνιδιού.

Μια ακόμα καινοτομία του Genie 3 είναι η δυνατότητα “promptable world events”: οι χρήστες μπορούν να μεταβάλουν, με απλές εντολές, στοιχεία του περιβάλλοντος όπως οι καιρικές συνθήκες ή να προσθέσουν νέους χαρακτήρες στον κόσμο.

Η DeepMind είχε παρουσιάσει τον Δεκέμβριο του 2024 το Genie 2, το οποίο μπορούσε να δημιουργεί διαδραστικούς κόσμους βασισμένους σε μία μόνο εικόνα. Η νέα ομάδα ανάπτυξης “world models” περιλαμβάνει, μάλιστα, πρώην συν-επικεφαλής του εργαλείου παραγωγής βίντεο Sora της OpenAI.

Περιορισμένη δοκιμή — Όχι (ακόμα) διαθέσιμο για το κοινό

Παρά τις τεχνικές εξελίξεις, το Genie 3 δεν είναι προς το παρόν διαθέσιμο στο ευρύ κοινό. Η Google το διαθέτει αποκλειστικά ως «περιορισμένο ερευνητικό δείγμα» σε μια μικρή ομάδα ακαδημαϊκών και δημιουργών, προκειμένου να μελετήσει τους πιθανούς κινδύνους και τρόπους αντιμετώπισής τους.

Υπάρχουν, επίσης, πολλοί περιορισμοί στη χρήση: το είδος της αλληλεπίδρασης παραμένει περιορισμένο, ενώ κατανοητό κείμενο μέσα στους κόσμους μπορεί να δημιουργηθεί μόνο αν έχει συμπεριληφθεί στην αρχική προτροπή. Η Google αναφέρει πως εξετάζει το ενδεχόμενο να διευρύνει την πρόσβαση στο εργαλείο σε περισσότερους δοκιμαστές στο μέλλον.

Με πληροφορίες από The Verge


 

Τech & Science
0

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Θέλει να γίνει το Android των ανθρωποειδών ρομπότ: H OpenMind υπόσχεται επανάσταση στη συμβίωση ανθρώπου–μηχανής

Τech & Science / Θέλει να γίνει το Android των ανθρωποειδών ρομπότ: H OpenMind υπόσχεται επανάσταση στη συμβίωση ανθρώπου–μηχανής

Με λογισμικό ανοικτού κώδικα που επιτρέπει στα ρομπότ να επικοινωνούν, να μαθαίνουν και να συνυπάρχουν, η νεοφυής εταιρεία από τη Silicon Valley φιλοδοξεί να γίνει το λειτουργικό σύστημα των ανθρωποειδών ρομπότ της επόμενης εποχής.
LIFO NEWSROOM
Aeneas: Η Google και ο Έλληνας Γιάννης Ασσαέλ δίνουν νέα ζωή στις ρωμαϊκές επιγραφές με εργαλείο AI

Τech & Science / Aeneas: Η Google και ο Έλληνας Γιάννης Ασσαέλ δίνουν νέα ζωή στις ρωμαϊκές επιγραφές με εργαλείο AI

Το σύστημα, που ονομάζεται Aeneas από τον μυθικό Τρωικό ήρωα, βοηθά τους ιστορικούς να ερμηνεύσουν, να αποδώσουν και να αποκαταστήσουν αρχαίες ρωμαϊκές επιγραφές
LIFO NEWSROOM

ΔΕΙΤΕ ΑΚΟΜΑ

ΚΙΝΑ ΔΙΑΣΤΗΜΑ SHENZOU 23

Τech & Science / Πειράματα με έμβρυα και καλλιέργειες ρυζιού στο διάστημα: Τι θα δοκιμάσει η Κίνα στην αποστολή Shenzhou-23

Η αποστολή προς τον διαστημικό σταθμό Tiangong περιλαμβάνει περισσότερα από 100 πειράματα, ενώ ένας από τους αστροναύτες θα παραμείνει σε τροχιά για έναν χρόνο
THE LIFO TEAM
Ο Πάπας Λέων ΙΔ΄ κάνει την τεχνητή νοημοσύνη θρησκευτικό ζήτημα στην πρώτη του εγκύκλιο

Διεθνή / Ο Πάπας Λέων ΙΔ' κάνει την τεχνητή νοημοσύνη θρησκευτικό ζήτημα στην πρώτη του εγκύκλιο

Στην πρώτη του εγκύκλιο, Magnifica humanitas, ο Πάπας Λέων ΙΔ' προειδοποιεί για την εξουσία των εταιρειών τεχνητής νοημοσύνης, ζητά ισχυρούς κανόνες και συνδέει την AI με την εργασία, τον πόλεμο, την ανισότητα και την ίδια την ανθρώπινη αξιοπρέπεια.
THE LIFO TEAM
Μια startup του Πίτερ Θίελ θέλει να βάζει τους δημοσιογράφους σε «δίκη» με τεχνητή νοημοσύνη

Τech & Science / Μια startup του Πίτερ Θίελ θέλει να βάζει τους δημοσιογράφους σε «δίκη» με τεχνητή νοημοσύνη

Το Objection υπόσχεται να ελέγχει δημοσιεύματα με τεχνητή νοημοσύνη και χρεώνει από 2.000 δολάρια για κάθε αμφισβήτηση. Οι επικριτές του βλέπουν ένα νέο εργαλείο πίεσης απέναντι σε ρεπόρτερ, εμπιστευτικές πηγές και ερευνητική δημοσιογραφία.
THE LIFO TEAM
INSTAGRAM INSTANTS

Τech & Science / Instagram Instants: Πώς μπορείτε να απενεργοποιήσετε τη νέα λειτουργία της πλατφόρμας

Το Instagram λάνσαρε παγκοσμίως τη νέα λειτουργία, επιχειρώντας να επιστρέψει στην πιο αυθόρμητη κοινοποίηση φωτογραφιών, με περιεχόμενο που εξαφανίζεται και θυμίζει εφαρμογές όπως το BeReal και το Snapchat
THE LIFO TEAM
Η Oprah έβαλε το Claude να ρωτήσει τον δημιουργό του γιατί χτίζει μια AI που φοβάται ο ίδιος

Τech & Science / Η Oprah έβαλε το Claude να ρωτήσει τον δημιουργό του γιατί χτίζει μια AI που φοβάται ο ίδιος

Από τα παιδιά που μιλούν κρυφά με chatbots μέχρι το Πεντάγωνο και ένα νέο μοντέλο που «μοιάζει με όπλο», οι ιδρυτές της Anthropic εξήγησαν στην Oprah γιατί η AI δεν είναι πια απλώς εργαλείο, αλλά ζήτημα εμπιστοσύνης.
THE LIFO TEAM