H DeepSeek καθυστερεί το νέο μοντέλο AI, αφού προσπάθησε να «απεξαρτηθεί» από τα τσιπ της Nvidia

H DeepSeek καθυστερεί το νέο μοντέλο AI, αφού προσπάθησε να «απεξαρτηθεί» από τα τσιπ της Nvidia Facebook Twitter
Φωτογραφία: EPA
0

Η κινεζική εταιρεία Τεχνητής Νοημοσύνης DeepSeek ανέβαλε την κυκλοφορία του νέου της μοντέλου R2, καθώς απέτυχε να το εκπαιδεύσει χρησιμοποιώντας τους επεξεργαστές Ascend της Huawei - εξέλιξη που υπογραμμίζει τα όρια της προσπάθειας του Πεκίνου να υποκαταστήσει την αμερικανική τεχνολογία.

Σύμφωνα με τρεις πηγές με γνώση του θέματος, οι κινεζικές αρχές ενθάρρυναν την εταιρεία να υιοθετήσει τα τσιπ της Huawei αντί για αυτά της Nvidia, μετά την κυκλοφορία του προηγούμενου μοντέλου R1 τον Ιανουάριο. Ωστόσο, η DeepSeek αντιμετώπισε επίμονα τεχνικά προβλήματα κατά την εκπαίδευση του R2 με τα Ascend, με αποτέλεσμα να στραφεί σε τσιπ Nvidia για το στάδιο της εκπαίδευσης και να χρησιμοποιήσει τα Huawei μόνο για την εξαγωγή συμπερασμάτων (inference).

Η εκπαίδευση -κατά την οποία το μοντέλο «μαθαίνει» από μεγάλα σύνολα δεδομένων- είναι κρίσιμη για την απόδοσή του. Αντίθετα, η εξαγωγή συμπερασμάτων αφορά τη χρήση του ήδη εκπαιδευμένου μοντέλου για προβλέψεις ή δημιουργία απαντήσεων, όπως σε ερωτήματα chatbot.

Τα τεχνικά εμπόδια καθυστέρησαν την Deepseek

Τα τεχνικά εμπόδια ήταν ο βασικός λόγος που η κυκλοφορία του R2, αρχικά προγραμματισμένη για τον Μάιο, αναβλήθηκε, με την εταιρεία να χάνει έδαφος έναντι ανταγωνιστών. Παράλληλα, η διαδικασία επισήμανσης δεδομένων για το νέο μοντέλο αποδείχθηκε πιο χρονοβόρα από το αναμενόμενο. Κινεζικά μέσα ενημέρωσης αναφέρουν ότι η κυκλοφορία ενδέχεται να γίνει μέσα στις επόμενες εβδομάδες.

Σύμφωνα με πηγές, η Huawei έστειλε ομάδα μηχανικών στα γραφεία της DeepSeek για να βοηθήσει στη χρήση του Ascend. Ωστόσο, παρά την επιτόπια υποστήριξη, δεν κατέστη δυνατή η ολοκλήρωση επιτυχούς εκπαιδευτικής περιόδου με τα κινεζικά τσιπ.

Η DeepSeek εξακολουθεί να συνεργάζεται με τη Huawei για να καταστήσει το μοντέλο συμβατό με το Ascend στο στάδιο της εξαγωγής συμπερασμάτων.

Η Deepseek και τα κινεζικά τσιπ «περιορισμένων δυνατοτήτων»

Η υπόθεση αναδεικνύει πώς τα κινεζικά τσιπ εξακολουθούν να υστερούν έναντι των αμερικανικών σε σταθερότητα, ταχύτητα διασύνδεσης και λογισμικό. Οι Financial Times αποκάλυψαν ότι το Πεκίνο έχει ζητήσει από κινεζικές τεχνολογικές εταιρείες να δικαιολογήσουν τις παραγγελίες τους για τους επεξεργαστές H20 της Nvidia, σε μια προσπάθεια να προωθήσει εναλλακτικές λύσεις από Huawei και Cambricon.

Ο Ritwik Gupta, ερευνητής Τεχνητής Νοημοσύνης στο Πανεπιστήμιο της Καλιφόρνια, σημείωσε ότι το Qwen3 της Alibaba έχει υιοθετήσει βασικές αρχές του DeepSeek, όπως τον αλγόριθμο εκπαίδευσης για βελτιωμένο συλλογισμό, αλλά με μεγαλύτερη αποδοτικότητα. Ο ίδιος πρόσθεσε ότι η Huawei αντιμετωπίζει «αυξανόμενες δυσκολίες» στην εκπαίδευση με το Ascend, αλλά εκτιμά ότι «είναι θέμα χρόνου» να φτάσει σε ανταγωνιστικό επίπεδο.

Η Nvidia, που βρίσκεται στο επίκεντρο της τεχνολογικής αντιπαράθεσης ΗΠΑ–Κίνας, συμφώνησε πρόσφατα να αποδώσει μέρος των εσόδων της από την Κίνα στην αμερικανική κυβέρνηση, προκειμένου να επαναλάβει τις πωλήσεις των H20 στη χώρα. Σε δήλωσή της, η εταιρεία υπογράμμισε: «Οι προγραμματιστές είναι κρίσιμοι για την οικοδόμηση του νικηφόρου οικοσυστήματος της Τεχνητής Νοημοσύνης. Η παράδοση ολόκληρων αγορών και προγραμματιστών θα έβλαπτε την αμερικανική οικονομική και εθνική ασφάλεια».

Με πληροφορίες από Financial Times

Τech & Science
0

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Το «deal» Τραμπ - Nvidia για τις πωλήσεις μικροτσιπ στην Κίνα: Το κράτος θα παίρνει το 15% των εσόδων

Διεθνή / Το «deal» Τραμπ - Nvidia για τις πωλήσεις μικροτσιπ στην Κίνα: Το κράτος θα παίρνει το 15% των εσόδων

Ο Αμερικανός πρόεδρος παζάρεψε την άδεια πώλησης της τεχνολογίας στην Κίνα, με τις τεχνολογικές εταιρείες Nvidia και AMD να συμφωνούν να αποδίδουν το 15% των πωλήσεών τους στο κράτος
LIFO NEWSROOM

ΔΕΙΤΕ ΑΚΟΜΑ

ΚΙΝΑ ΔΙΑΣΤΗΜΑ SHENZOU 23

Τech & Science / Πειράματα με έμβρυα και καλλιέργειες ρυζιού στο διάστημα: Τι θα δοκιμάσει η Κίνα στην αποστολή Shenzhou-23

Η αποστολή προς τον διαστημικό σταθμό Tiangong περιλαμβάνει περισσότερα από 100 πειράματα, ενώ ένας από τους αστροναύτες θα παραμείνει σε τροχιά για έναν χρόνο
THE LIFO TEAM
Ο Πάπας Λέων ΙΔ΄ κάνει την τεχνητή νοημοσύνη θρησκευτικό ζήτημα στην πρώτη του εγκύκλιο

Διεθνή / Ο Πάπας Λέων ΙΔ' κάνει την τεχνητή νοημοσύνη θρησκευτικό ζήτημα στην πρώτη του εγκύκλιο

Στην πρώτη του εγκύκλιο, Magnifica humanitas, ο Πάπας Λέων ΙΔ' προειδοποιεί για την εξουσία των εταιρειών τεχνητής νοημοσύνης, ζητά ισχυρούς κανόνες και συνδέει την AI με την εργασία, τον πόλεμο, την ανισότητα και την ίδια την ανθρώπινη αξιοπρέπεια.
THE LIFO TEAM
Μια startup του Πίτερ Θίελ θέλει να βάζει τους δημοσιογράφους σε «δίκη» με τεχνητή νοημοσύνη

Τech & Science / Μια startup του Πίτερ Θίελ θέλει να βάζει τους δημοσιογράφους σε «δίκη» με τεχνητή νοημοσύνη

Το Objection υπόσχεται να ελέγχει δημοσιεύματα με τεχνητή νοημοσύνη και χρεώνει από 2.000 δολάρια για κάθε αμφισβήτηση. Οι επικριτές του βλέπουν ένα νέο εργαλείο πίεσης απέναντι σε ρεπόρτερ, εμπιστευτικές πηγές και ερευνητική δημοσιογραφία.
THE LIFO TEAM
INSTAGRAM INSTANTS

Τech & Science / Instagram Instants: Πώς μπορείτε να απενεργοποιήσετε τη νέα λειτουργία της πλατφόρμας

Το Instagram λάνσαρε παγκοσμίως τη νέα λειτουργία, επιχειρώντας να επιστρέψει στην πιο αυθόρμητη κοινοποίηση φωτογραφιών, με περιεχόμενο που εξαφανίζεται και θυμίζει εφαρμογές όπως το BeReal και το Snapchat
THE LIFO TEAM
Η Oprah έβαλε το Claude να ρωτήσει τον δημιουργό του γιατί χτίζει μια AI που φοβάται ο ίδιος

Τech & Science / Η Oprah έβαλε το Claude να ρωτήσει τον δημιουργό του γιατί χτίζει μια AI που φοβάται ο ίδιος

Από τα παιδιά που μιλούν κρυφά με chatbots μέχρι το Πεντάγωνο και ένα νέο μοντέλο που «μοιάζει με όπλο», οι ιδρυτές της Anthropic εξήγησαν στην Oprah γιατί η AI δεν είναι πια απλώς εργαλείο, αλλά ζήτημα εμπιστοσύνης.
THE LIFO TEAM