Η Microsoft παρουσίασε τρία νέα μοντέλα τεχνητής νοημοσύνης που μπορούν να παράγουν κείμενο, φωνή και εικόνα, ενισχύοντας τη στρατηγική της να αναπτύξει δική της τεχνολογική βάση στον ταχέως αναπτυσσόμενο χώρο της γενετικής AI.
Τα νέα μοντέλα εντάσσονται σε μια ευρύτερη προσπάθεια της εταιρείας να ανταγωνιστεί άλλες μεγάλες πλατφόρμες, όπως η Google και η OpenAI, παρά το γεγονός ότι διατηρεί στενή συνεργασία με τη δεύτερη.
Συγκεκριμένα, το MAI-Transcribe-1 μετατρέπει ομιλία σε κείμενο σε 25 γλώσσες και, σύμφωνα με την εταιρεία, είναι σημαντικά ταχύτερο από υφιστάμενες υπηρεσίες της. Το MAI-Voice-1 επιτρέπει τη δημιουργία ηχητικού περιεχομένου, δίνοντας τη δυνατότητα παραγωγής έως και 60 δευτερολέπτων ήχου μέσα σε ένα δευτερόλεπτο, καθώς και τη δημιουργία εξατομικευμένων φωνών. Το MAI-Image-2 αφορά την παραγωγή οπτικού περιεχομένου, επεκτείνοντας τις δυνατότητες της πλατφόρμας σε πολυτροπικά μοντέλα.
Τα εργαλεία αναπτύχθηκαν από την ερευνητική ομάδα MAI Superintelligence, υπό την καθοδήγηση του Μουσταφά Σουλεϊμάν, και διατίθενται μέσω των πλατφορμών Microsoft Foundry και MAI Playground, όπου οι χρήστες μπορούν να δοκιμάσουν και να αξιοποιήσουν τις δυνατότητές τους.
We’re bringing our growing MAI model family to every developer in Foundry, including …
— Satya Nadella (@satyanadella) April 2, 2026
· MAI-Transcribe-1, most accurate transcription model in world across 25 languages
· MAI-Voice-1, natural, expressive speech generation
· MAI-Image-2, our most capable image model yet
Start… pic.twitter.com/p0DZZcAUZ4
Ο Σουλεϊμάν ανέφερε ότι η εταιρεία επιδιώκει την ανάπτυξη «ανθρωποκεντρικής» τεχνητής νοημοσύνης, με έμφαση στη χρηστικότητα και την προσαρμογή στις πραγματικές ανάγκες των χρηστών.
Η Microsoft εκτιμά ότι ένα από τα βασικά πλεονεκτήματα των νέων μοντέλων είναι το χαμηλότερο κόστος σε σχέση με ανταγωνιστικές λύσεις, σε μια αγορά όπου ο ανταγωνισμός εντείνεται και οι επιχειρήσεις αναζητούν πιο αποδοτικές επιλογές.
Παράλληλα, η εταιρεία διατηρεί τη στρατηγική συνεργασία της με την OpenAI, στην οποία έχει επενδύσει περισσότερα από 13 δισ. δολάρια, ενώ φιλοξενεί τα μοντέλα της σε ευρύ φάσμα προϊόντων. Σύμφωνα με τη διοίκηση, η ανάπτυξη ιδιόκτητων μοντέλων δεν αναιρεί τη συνεργασία, αλλά ενισχύει τη συνολική της παρουσία στον χώρο της τεχνητής νοημοσύνης.
Η κίνηση αυτή εντάσσεται σε μια ευρύτερη τάση μεταξύ μεγάλων τεχνολογικών εταιρειών να αναπτύσσουν παράλληλα δικές τους υποδομές και συνεργασίες, σε μια αγορά που εξελίσσεται ταχύτατα και αποκτά όλο και μεγαλύτερη στρατηγική σημασία.
Με πληροφορίες από TechCrunch