Ο πόλεμος της τεχνητής νοημοσύνης: Η Alibaba παρουσίασε μοντέλο που «ξεπερνά σε όλα» ChatGPT και Deepseek

Ο πόλεμος της τεχνητής νοημοσύνης: Η Alibaba παρουσίασε μοντέλο που ισχυρίζεται πως υπερτερεί του DeepSeek Facebook Twitter
Φωτ: Pixabay
0

Η κινεζική τεχνολογική εταιρεία Alibaba παρουσίασε σήμερα μια νέα εκδοχή του μοντέλου τεχνητής νοημοσύνης της Qwen 2.5, για την οποία υποστηρίζει πως υπερτερεί του περίφημου DeepSeek-V3.

Ο ασυνήθιστος χρόνος της κυκλοφορίας του Qwen 2.5-Max, την πρώτη ημέρα του Σεληνιακού Νέου Έτους, όταν οι περισσότεροι Κινέζοι έχουν αργία και βρίσκονται με τις οικογένειές τους, σηματοδοτεί την πίεση που ασκεί η μετεωρική άνοδος τις τρεις τελευταίες εβδομάδες της κινεζικής εταιρείας τεχνητής νοημοσύνης DeepSeek, όχι μόνο στους ανταγωνιστές της στο εξωτερικό, αλλά και στον εγχώριο ανταγωνισμό.

«Το Qwen 2.5-Max ξεπερνάει σχεδόν σε όλα τα GPT-4o, DeepSeek-V3 και Llama-3.1-405B», αναφέρει η μονάδα cloud της Alibaba σε ανακοίνωσή της την οποία ανήρτησε στον επίσημο λογαριασμό της στο WeChat, αναφερόμενη στα πιο εξελιγμένα μοντέλα τεχνητής νοημοσύνης ανοικτού κώδικα.

Η παρουσίαση στις 10 Ιανουαρίου του βοηθού τεχνητής νοημοσύνης της DeepSeek, με βάση το μοντέλο DeepSeek-V3, καθώς και η παρουσίαση στις 20 Ιανουαρίου του μοντέλου της R1, προκάλεσε σοκ στην Σίλικον Βάλεϊ και έριξε τις μετοχές των τεχνολογικών εταιρειών, καθώς τα χαμηλά κόστη ανάπτυξης και χρήσης της κινεζικής startup έκαναν τους επενδυτές να αμφισβητήσουν τα σχέδια για τεράστιες δαπάνες από τις κορυφαίες εταιρείες τεχνητής νοημοσύνης στις ΗΠΑ.

Ωστόσο η επιτυχία της DeepSeek έκανε επίσης τους εγχώριους ανταγωνιστές της να αναβαθμίσουν τα δικά τους μοντέλα τεχνητής νοημοσύνης.

Δύο ημέρες μετά την παρουσίαση του DeepSeek-R1, η ιδιοκτήτρια του TikTok, η ByteDance, παρουσίασε μια επικαιροποίηση του δικού της βασικού μοντέλου τεχνητής νοημοσύνης, για το οποίο ισχυρίστηκε πως έχει καλύτερες επιδόσεις από το υποστηριζόμενο από τη Microsoft o1 της OpenAI στο AIME, ένα τεστ που μετράει πόσο καλά τα μοντέλα τεχνητής νοημοσύνης κατανοούν περίπλοκες οδηγίες και ανταποκρίνονται σ' αυτές.

Αυτό απηχεί τον ισχυρισμό της DeepSeek ότι το μοντέλο της R1 υπερτερεί σε αρκετά κριτήρια απόδοσης του o1 της OpenAI.

Τech & Science
0

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

ΔΕΙΤΕ ΑΚΟΜΑ

Επιστημονικό ορόσημο: Γεγονός η πρώτη εγκυμοσύνη με τη χρήση τεχνητής νοημοσύνης

Τech & Science / Επιστημονικό ορόσημο: Γεγονός η πρώτη εγκυμοσύνη με τη χρήση τεχνητής νοημοσύνης

Το σύστημα STAR (Sperm Track and Recovery) και αντλεί την έμπνευσή του από παρόμοιες μεθόδους που χρησιμοποιούν οι αστροφυσικοί για την ανίχνευση νέων άστρων ή πλανητών μέσω τεχνητής νοημοσύνης
ΕΠΙΜΕΛΕΙΑ: ΑΓΑΠΗ ΒΑΡΟΥΝΗ
Apple: Οι καθυστερήσεις αναβάθμισης της Siri με Τεχνητή Νοημοσύνη προβληματίζουν τους επενδυτές

Τech & Science / Apple: Οι καθυστερήσεις αναβάθμισης της Siri με Τεχνητή Νοημοσύνη προβληματίζουν τους επενδυτές

Οι προσπάθειες ενσωμάτωσης του Apple Intelligence δεν έχουν ακόμη αποδώσει - Η Apple βρίσκεται «ουσιαστικά τρία χρόνια πίσω» στην ανάπτυξη ενός σύγχρονου φωνητικού βοηθού, επισημαίνουν αναλυτές
LIFO NEWSROOM
Η τεχνολογία πίσω από τα εμβόλια Covid φέρνει ελπίδες για θεραπεία του HIV

Τech & Science / Η τεχνολογία πίσω από τα εμβόλια Covid φέρνει ελπίδες για θεραπεία του HIV

Αυστραλοί ερευνητές ανακοίνωσαν ότι, χρησιμοποιώντας mRNA, κατάφεραν να «ξεγελάσουν» τον ιό ώστε να βγει από την κρυψώνα του – ένα κρίσιμο βήμα για την πλήρη εξάλειψή του από τον οργανισμό
LIFO NEWSROOM
Μία ιαπωνική εταιρεία θέλει να χτίσει πόλη στη Σελήνη μέχρι το 2040 - Αλλά πρώτα πρέπει να φτάσει

Τech & Science / Μία ιαπωνική εταιρεία θέλει να χτίσει πόλη στη Σελήνη μέχρι το 2040 - Αλλά πρώτα πρέπει να φτάσει

Η εταιρεία φιλοδοξεί να δημιουργήσει, μέσα στις επόμενες δεκαετίες, σεληνιακές υποδομές ικανές να υποστηρίξουν 1.000 κατοίκους και να υποδέχονται χιλιάδες επισκέπτες
LIFO NEWSROOM