H DeepSeek καθυστερεί το νέο μοντέλο AI, αφού προσπάθησε να «απεξαρτηθεί» από τα τσιπ της Nvidia

H DeepSeek καθυστερεί το νέο μοντέλο AI, αφού προσπάθησε να «απεξαρτηθεί» από τα τσιπ της Nvidia Facebook Twitter
Φωτογραφία: EPA
0

Η κινεζική εταιρεία Τεχνητής Νοημοσύνης DeepSeek ανέβαλε την κυκλοφορία του νέου της μοντέλου R2, καθώς απέτυχε να το εκπαιδεύσει χρησιμοποιώντας τους επεξεργαστές Ascend της Huawei - εξέλιξη που υπογραμμίζει τα όρια της προσπάθειας του Πεκίνου να υποκαταστήσει την αμερικανική τεχνολογία.

Σύμφωνα με τρεις πηγές με γνώση του θέματος, οι κινεζικές αρχές ενθάρρυναν την εταιρεία να υιοθετήσει τα τσιπ της Huawei αντί για αυτά της Nvidia, μετά την κυκλοφορία του προηγούμενου μοντέλου R1 τον Ιανουάριο. Ωστόσο, η DeepSeek αντιμετώπισε επίμονα τεχνικά προβλήματα κατά την εκπαίδευση του R2 με τα Ascend, με αποτέλεσμα να στραφεί σε τσιπ Nvidia για το στάδιο της εκπαίδευσης και να χρησιμοποιήσει τα Huawei μόνο για την εξαγωγή συμπερασμάτων (inference).

Η εκπαίδευση -κατά την οποία το μοντέλο «μαθαίνει» από μεγάλα σύνολα δεδομένων- είναι κρίσιμη για την απόδοσή του. Αντίθετα, η εξαγωγή συμπερασμάτων αφορά τη χρήση του ήδη εκπαιδευμένου μοντέλου για προβλέψεις ή δημιουργία απαντήσεων, όπως σε ερωτήματα chatbot.

Τα τεχνικά εμπόδια καθυστέρησαν την Deepseek

Τα τεχνικά εμπόδια ήταν ο βασικός λόγος που η κυκλοφορία του R2, αρχικά προγραμματισμένη για τον Μάιο, αναβλήθηκε, με την εταιρεία να χάνει έδαφος έναντι ανταγωνιστών. Παράλληλα, η διαδικασία επισήμανσης δεδομένων για το νέο μοντέλο αποδείχθηκε πιο χρονοβόρα από το αναμενόμενο. Κινεζικά μέσα ενημέρωσης αναφέρουν ότι η κυκλοφορία ενδέχεται να γίνει μέσα στις επόμενες εβδομάδες.

Σύμφωνα με πηγές, η Huawei έστειλε ομάδα μηχανικών στα γραφεία της DeepSeek για να βοηθήσει στη χρήση του Ascend. Ωστόσο, παρά την επιτόπια υποστήριξη, δεν κατέστη δυνατή η ολοκλήρωση επιτυχούς εκπαιδευτικής περιόδου με τα κινεζικά τσιπ.

Η DeepSeek εξακολουθεί να συνεργάζεται με τη Huawei για να καταστήσει το μοντέλο συμβατό με το Ascend στο στάδιο της εξαγωγής συμπερασμάτων.

Η Deepseek και τα κινεζικά τσιπ «περιορισμένων δυνατοτήτων»

Η υπόθεση αναδεικνύει πώς τα κινεζικά τσιπ εξακολουθούν να υστερούν έναντι των αμερικανικών σε σταθερότητα, ταχύτητα διασύνδεσης και λογισμικό. Οι Financial Times αποκάλυψαν ότι το Πεκίνο έχει ζητήσει από κινεζικές τεχνολογικές εταιρείες να δικαιολογήσουν τις παραγγελίες τους για τους επεξεργαστές H20 της Nvidia, σε μια προσπάθεια να προωθήσει εναλλακτικές λύσεις από Huawei και Cambricon.

Ο Ritwik Gupta, ερευνητής Τεχνητής Νοημοσύνης στο Πανεπιστήμιο της Καλιφόρνια, σημείωσε ότι το Qwen3 της Alibaba έχει υιοθετήσει βασικές αρχές του DeepSeek, όπως τον αλγόριθμο εκπαίδευσης για βελτιωμένο συλλογισμό, αλλά με μεγαλύτερη αποδοτικότητα. Ο ίδιος πρόσθεσε ότι η Huawei αντιμετωπίζει «αυξανόμενες δυσκολίες» στην εκπαίδευση με το Ascend, αλλά εκτιμά ότι «είναι θέμα χρόνου» να φτάσει σε ανταγωνιστικό επίπεδο.

Η Nvidia, που βρίσκεται στο επίκεντρο της τεχνολογικής αντιπαράθεσης ΗΠΑ–Κίνας, συμφώνησε πρόσφατα να αποδώσει μέρος των εσόδων της από την Κίνα στην αμερικανική κυβέρνηση, προκειμένου να επαναλάβει τις πωλήσεις των H20 στη χώρα. Σε δήλωσή της, η εταιρεία υπογράμμισε: «Οι προγραμματιστές είναι κρίσιμοι για την οικοδόμηση του νικηφόρου οικοσυστήματος της Τεχνητής Νοημοσύνης. Η παράδοση ολόκληρων αγορών και προγραμματιστών θα έβλαπτε την αμερικανική οικονομική και εθνική ασφάλεια».

Με πληροφορίες από Financial Times

Τech & Science
0

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Το «deal» Τραμπ - Nvidia για τις πωλήσεις μικροτσιπ στην Κίνα: Το κράτος θα παίρνει το 15% των εσόδων

Διεθνή / Το «deal» Τραμπ - Nvidia για τις πωλήσεις μικροτσιπ στην Κίνα: Το κράτος θα παίρνει το 15% των εσόδων

Ο Αμερικανός πρόεδρος παζάρεψε την άδεια πώλησης της τεχνολογίας στην Κίνα, με τις τεχνολογικές εταιρείες Nvidia και AMD να συμφωνούν να αποδίδουν το 15% των πωλήσεών τους στο κράτος
LIFO NEWSROOM

ΔΕΙΤΕ ΑΚΟΜΑ

Grok: Συνεχίζεται η δημοσίευση εικόνων γυναικών και παιδιών με «ελάχιστο ρουχισμό» παρά τη δέσμευση για αναστολή λογαριασμών

Τech & Science / Grok: Συνεχίζεται η δημοσίευση εικόνων γυναικών και παιδιών με «ελάχιστο ρουχισμό» παρά τη δέσμευση για αναστολή λογαριασμών

Μετά την παγκόσμια κατακραυγή, ο Μασκ έγραψε σε ανάρτησή του πως «όποιος χρησιμοποιεί το Grok για να δημιουργεί παράνομο περιεχόμενο θα υποστεί τις ίδιες συνέπειες σαν να ανεβάζει παράνομο περιεχόμενο»
THE LIFO TEAM
ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ ΚΙΝΔΥΝΟΙ

Τech & Science / Ερευνητής προειδοποιεί ότι ο κόσμος ίσως να μην προλάβει να προετοιμαστεί για τους κινδύνους της Τεχνητής Νοημοσύνης

Ο ερευνητής ανέφερε πως οι κυβερνήσεις δεν θα πρέπει να θεωρούν δεδομένη την αξιοπιστία των προηγμένων συστημάτων Τεχνητής Νοημοσύνης
THE LIFO TEAM
ΔΙΑΤΡΟΦΗ ΚΑΛΥΤΕΡΟΣ ΥΠΝΟΣ ΜΑΚΡΟΖΩΙΑ

Τech & Science / Αυτή η διατροφή μπορεί να βοηθήσει να κοιμάστε καλύτερα και να ζήσετε περισσότερο

Πρόκειται για την «ξαδέλφη» της μεσογειακής διατροφής, όπως γράφει το Νational Geographic, προσφέροντας τα ίδια οφέλη για την υγεία χάρη στον συνδυασμό τροφών πλούσιων σε αντιφλεγμονώδη και αντιοξειδωτικά
THE LIFO TEAM
Μελέτη αποκαλύπτει πώς η τεχνητή νοημοσύνη επηρεάζει τη θεραπεία των καρδιακών παθήσεων

Τech & Science / Μελέτη αποκαλύπτει πώς η τεχνητή νοημοσύνη επηρεάζει τη θεραπεία των καρδιακών παθήσεων

Ερευνητές αναφέρουν ότι η προηγμένη τεχνολογία θα μπορούσε να υποστηρίξει πιο εξατομικευμένη φροντίδα, επιτρέποντας οι θεραπείες να προσαρμόζονται καλύτερα στον τρόπο με τον οποίο λειτουργεί η καρδιά κάθε ατόμου
THE LIFO TEAM