Η κινεζική εταιρεία Τεχνητής Νοημοσύνης DeepSeek ανέβαλε την κυκλοφορία του νέου της μοντέλου R2, καθώς απέτυχε να το εκπαιδεύσει χρησιμοποιώντας τους επεξεργαστές Ascend της Huawei - εξέλιξη που υπογραμμίζει τα όρια της προσπάθειας του Πεκίνου να υποκαταστήσει την αμερικανική τεχνολογία.
Σύμφωνα με τρεις πηγές με γνώση του θέματος, οι κινεζικές αρχές ενθάρρυναν την εταιρεία να υιοθετήσει τα τσιπ της Huawei αντί για αυτά της Nvidia, μετά την κυκλοφορία του προηγούμενου μοντέλου R1 τον Ιανουάριο. Ωστόσο, η DeepSeek αντιμετώπισε επίμονα τεχνικά προβλήματα κατά την εκπαίδευση του R2 με τα Ascend, με αποτέλεσμα να στραφεί σε τσιπ Nvidia για το στάδιο της εκπαίδευσης και να χρησιμοποιήσει τα Huawei μόνο για την εξαγωγή συμπερασμάτων (inference).
Η εκπαίδευση -κατά την οποία το μοντέλο «μαθαίνει» από μεγάλα σύνολα δεδομένων- είναι κρίσιμη για την απόδοσή του. Αντίθετα, η εξαγωγή συμπερασμάτων αφορά τη χρήση του ήδη εκπαιδευμένου μοντέλου για προβλέψεις ή δημιουργία απαντήσεων, όπως σε ερωτήματα chatbot.
Τα τεχνικά εμπόδια καθυστέρησαν την Deepseek
Τα τεχνικά εμπόδια ήταν ο βασικός λόγος που η κυκλοφορία του R2, αρχικά προγραμματισμένη για τον Μάιο, αναβλήθηκε, με την εταιρεία να χάνει έδαφος έναντι ανταγωνιστών. Παράλληλα, η διαδικασία επισήμανσης δεδομένων για το νέο μοντέλο αποδείχθηκε πιο χρονοβόρα από το αναμενόμενο. Κινεζικά μέσα ενημέρωσης αναφέρουν ότι η κυκλοφορία ενδέχεται να γίνει μέσα στις επόμενες εβδομάδες.
Σύμφωνα με πηγές, η Huawei έστειλε ομάδα μηχανικών στα γραφεία της DeepSeek για να βοηθήσει στη χρήση του Ascend. Ωστόσο, παρά την επιτόπια υποστήριξη, δεν κατέστη δυνατή η ολοκλήρωση επιτυχούς εκπαιδευτικής περιόδου με τα κινεζικά τσιπ.
Η DeepSeek εξακολουθεί να συνεργάζεται με τη Huawei για να καταστήσει το μοντέλο συμβατό με το Ascend στο στάδιο της εξαγωγής συμπερασμάτων.
Η Deepseek και τα κινεζικά τσιπ «περιορισμένων δυνατοτήτων»
Η υπόθεση αναδεικνύει πώς τα κινεζικά τσιπ εξακολουθούν να υστερούν έναντι των αμερικανικών σε σταθερότητα, ταχύτητα διασύνδεσης και λογισμικό. Οι Financial Times αποκάλυψαν ότι το Πεκίνο έχει ζητήσει από κινεζικές τεχνολογικές εταιρείες να δικαιολογήσουν τις παραγγελίες τους για τους επεξεργαστές H20 της Nvidia, σε μια προσπάθεια να προωθήσει εναλλακτικές λύσεις από Huawei και Cambricon.
Ο Ritwik Gupta, ερευνητής Τεχνητής Νοημοσύνης στο Πανεπιστήμιο της Καλιφόρνια, σημείωσε ότι το Qwen3 της Alibaba έχει υιοθετήσει βασικές αρχές του DeepSeek, όπως τον αλγόριθμο εκπαίδευσης για βελτιωμένο συλλογισμό, αλλά με μεγαλύτερη αποδοτικότητα. Ο ίδιος πρόσθεσε ότι η Huawei αντιμετωπίζει «αυξανόμενες δυσκολίες» στην εκπαίδευση με το Ascend, αλλά εκτιμά ότι «είναι θέμα χρόνου» να φτάσει σε ανταγωνιστικό επίπεδο.
Η Nvidia, που βρίσκεται στο επίκεντρο της τεχνολογικής αντιπαράθεσης ΗΠΑ–Κίνας, συμφώνησε πρόσφατα να αποδώσει μέρος των εσόδων της από την Κίνα στην αμερικανική κυβέρνηση, προκειμένου να επαναλάβει τις πωλήσεις των H20 στη χώρα. Σε δήλωσή της, η εταιρεία υπογράμμισε: «Οι προγραμματιστές είναι κρίσιμοι για την οικοδόμηση του νικηφόρου οικοσυστήματος της Τεχνητής Νοημοσύνης. Η παράδοση ολόκληρων αγορών και προγραμματιστών θα έβλαπτε την αμερικανική οικονομική και εθνική ασφάλεια».
Με πληροφορίες από Financial Times