H DeepSeek καθυστερεί το νέο μοντέλο AI, αφού προσπάθησε να «απεξαρτηθεί» από τα τσιπ της Nvidia

H DeepSeek καθυστερεί το νέο μοντέλο AI, αφού προσπάθησε να «απεξαρτηθεί» από τα τσιπ της Nvidia Facebook Twitter
Φωτογραφία: EPA
0

Η κινεζική εταιρεία Τεχνητής Νοημοσύνης DeepSeek ανέβαλε την κυκλοφορία του νέου της μοντέλου R2, καθώς απέτυχε να το εκπαιδεύσει χρησιμοποιώντας τους επεξεργαστές Ascend της Huawei - εξέλιξη που υπογραμμίζει τα όρια της προσπάθειας του Πεκίνου να υποκαταστήσει την αμερικανική τεχνολογία.

Σύμφωνα με τρεις πηγές με γνώση του θέματος, οι κινεζικές αρχές ενθάρρυναν την εταιρεία να υιοθετήσει τα τσιπ της Huawei αντί για αυτά της Nvidia, μετά την κυκλοφορία του προηγούμενου μοντέλου R1 τον Ιανουάριο. Ωστόσο, η DeepSeek αντιμετώπισε επίμονα τεχνικά προβλήματα κατά την εκπαίδευση του R2 με τα Ascend, με αποτέλεσμα να στραφεί σε τσιπ Nvidia για το στάδιο της εκπαίδευσης και να χρησιμοποιήσει τα Huawei μόνο για την εξαγωγή συμπερασμάτων (inference).

Η εκπαίδευση -κατά την οποία το μοντέλο «μαθαίνει» από μεγάλα σύνολα δεδομένων- είναι κρίσιμη για την απόδοσή του. Αντίθετα, η εξαγωγή συμπερασμάτων αφορά τη χρήση του ήδη εκπαιδευμένου μοντέλου για προβλέψεις ή δημιουργία απαντήσεων, όπως σε ερωτήματα chatbot.

Τα τεχνικά εμπόδια καθυστέρησαν την Deepseek

Τα τεχνικά εμπόδια ήταν ο βασικός λόγος που η κυκλοφορία του R2, αρχικά προγραμματισμένη για τον Μάιο, αναβλήθηκε, με την εταιρεία να χάνει έδαφος έναντι ανταγωνιστών. Παράλληλα, η διαδικασία επισήμανσης δεδομένων για το νέο μοντέλο αποδείχθηκε πιο χρονοβόρα από το αναμενόμενο. Κινεζικά μέσα ενημέρωσης αναφέρουν ότι η κυκλοφορία ενδέχεται να γίνει μέσα στις επόμενες εβδομάδες.

Σύμφωνα με πηγές, η Huawei έστειλε ομάδα μηχανικών στα γραφεία της DeepSeek για να βοηθήσει στη χρήση του Ascend. Ωστόσο, παρά την επιτόπια υποστήριξη, δεν κατέστη δυνατή η ολοκλήρωση επιτυχούς εκπαιδευτικής περιόδου με τα κινεζικά τσιπ.

Η DeepSeek εξακολουθεί να συνεργάζεται με τη Huawei για να καταστήσει το μοντέλο συμβατό με το Ascend στο στάδιο της εξαγωγής συμπερασμάτων.

Η Deepseek και τα κινεζικά τσιπ «περιορισμένων δυνατοτήτων»

Η υπόθεση αναδεικνύει πώς τα κινεζικά τσιπ εξακολουθούν να υστερούν έναντι των αμερικανικών σε σταθερότητα, ταχύτητα διασύνδεσης και λογισμικό. Οι Financial Times αποκάλυψαν ότι το Πεκίνο έχει ζητήσει από κινεζικές τεχνολογικές εταιρείες να δικαιολογήσουν τις παραγγελίες τους για τους επεξεργαστές H20 της Nvidia, σε μια προσπάθεια να προωθήσει εναλλακτικές λύσεις από Huawei και Cambricon.

Ο Ritwik Gupta, ερευνητής Τεχνητής Νοημοσύνης στο Πανεπιστήμιο της Καλιφόρνια, σημείωσε ότι το Qwen3 της Alibaba έχει υιοθετήσει βασικές αρχές του DeepSeek, όπως τον αλγόριθμο εκπαίδευσης για βελτιωμένο συλλογισμό, αλλά με μεγαλύτερη αποδοτικότητα. Ο ίδιος πρόσθεσε ότι η Huawei αντιμετωπίζει «αυξανόμενες δυσκολίες» στην εκπαίδευση με το Ascend, αλλά εκτιμά ότι «είναι θέμα χρόνου» να φτάσει σε ανταγωνιστικό επίπεδο.

Η Nvidia, που βρίσκεται στο επίκεντρο της τεχνολογικής αντιπαράθεσης ΗΠΑ–Κίνας, συμφώνησε πρόσφατα να αποδώσει μέρος των εσόδων της από την Κίνα στην αμερικανική κυβέρνηση, προκειμένου να επαναλάβει τις πωλήσεις των H20 στη χώρα. Σε δήλωσή της, η εταιρεία υπογράμμισε: «Οι προγραμματιστές είναι κρίσιμοι για την οικοδόμηση του νικηφόρου οικοσυστήματος της Τεχνητής Νοημοσύνης. Η παράδοση ολόκληρων αγορών και προγραμματιστών θα έβλαπτε την αμερικανική οικονομική και εθνική ασφάλεια».

Με πληροφορίες από Financial Times

Τech & Science
0

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Το «deal» Τραμπ - Nvidia για τις πωλήσεις μικροτσιπ στην Κίνα: Το κράτος θα παίρνει το 15% των εσόδων

Διεθνή / Το «deal» Τραμπ - Nvidia για τις πωλήσεις μικροτσιπ στην Κίνα: Το κράτος θα παίρνει το 15% των εσόδων

Ο Αμερικανός πρόεδρος παζάρεψε την άδεια πώλησης της τεχνολογίας στην Κίνα, με τις τεχνολογικές εταιρείες Nvidia και AMD να συμφωνούν να αποδίδουν το 15% των πωλήσεών τους στο κράτος
LIFO NEWSROOM

ΔΕΙΤΕ ΑΚΟΜΑ

Βρισκόμαστε πιο κοντά από ποτέ σ’ ένα πυρηνικό ολοκαύτωμα;

Τech & Science / Πόσο κοντά βρισκόμαστε σ’ ένα πυρηνικό ολοκαύτωμα;

Σύμφωνα με το βιβλίο «Nuclear Age», ο κίνδυνος είναι μεγαλύτερος από ποτέ, με την παρουσία τουλάχιστον εννέα πυρηνικών δυνάμεων και την έλλειψη αποτελεσματικού διεθνούς πλαισίου για τον περιορισμό της απειλής.
LIFO NEWSROOM
Η Ε.Ε. αποσύρει iPhone από την αγορά λόγω υπερβολικής ακτινοβολίας

Τech & Science / Η ΕΕ αποσύρει iPhone από την αγορά λόγω υπερβολικής ακτινοβολίας

Η υπόθεση ξεκίνησε στη Γαλλία, όταν τεχνικοί έλεγχοι αποκάλυψαν ότι το συγκεκριμένο μοντέλο ξεπερνούσε το όριο SAR, δηλαδή τον δείκτη που υπολογίζει πόση ακτινοβολία απορροφά ο ανθρώπινος οργανισμός
LIFO NEWSROOM
Αυξάνονται τα κρούσματα υπνικής άπνοιας στους καύσωνες

Τech & Science / Αυξάνονται τα κρούσματα υπνικής άπνοιας στους καύσωνες

Η υπνική άπνοια, κατά την οποία η αναπνοή του ατόμου διακόπτεται κατά τη διάρκεια της νύχτας, δεν προκαλεί απλώς υπερβολική υπνηλία, αλλά μπορεί να αυξήσει τον κίνδυνο υπέρτασης, εγκεφαλικού επεισοδίου, καρδιακών παθήσεων και διαβήτη τύπου 2
LIFO NEWSROOM
Παγκόσμια βλάβη στη Microsoft: Προβλήματα σε Outlook, Teams, Minecraft και μεγάλες εταιρείες

Τech & Science / Παγκόσμια βλάβη στη Microsoft: Προβλήματα σε Outlook, Teams, Minecraft και μεγάλες εταιρείες

Η εταιρεία αναφέρει ότι «ορισμένοι χρήστες του Microsoft 365 ενδέχεται να αντιμετωπίζουν καθυστερήσεις ή δυσκολίες σύνδεσης», ενώ οι μηχανικοί της εργάζονται για την πλήρη αποκατάσταση των υπηρεσιών
LIFO NEWSROOM
Τουρκία: Σπίτι στην Πισιδία χτίστηκε με λίθους που φέρουν στα ελληνικά επιστολή του Ρωμαίου αυτοκράτορα Καρακάλλα

Τech & Science / Τουρκία: Σπίτι στην Πισιδία χτίστηκε με λίθους που φέρουν στα ελληνικά επιστολή του Ρωμαίου αυτοκράτορα Καρακάλλα

Το σπίτι χτίστηκε τη δεκαετία του 1950 από κατοίκους που, δίχως να το γνωρίζουν, χρησιμοποίησαν πέτρες από τα ερείπια της αρχαίας πόλης Τακίνα στο Πολυδώριο Πισιδίας
LIFO NEWSROOM