DeepSeek: Η εμφατική πρόοδος φέρνει πιο φτηνή τεχνητή νοημοσύνη

Η χρήση της «ενισχυτικής μάθησης» και των «μικρών γλωσσικών μοντέλων» από την κινεζική ομάδα τεχνητής νοημοσύνης οδηγεί σε ανακαλύψεις

LifO Newsroom UPDATED 29.1.2025 | 13:24

DeepSeek: Η εμφατική πρόοδος φέρνει πιο φτηνή τεχνητή νοημοσύνη — ChatGPT και DeepSeek εγκατεστημένες σε Iphone/ Φωτ.: Getty

UPD 29.1.2025 | 13:24

Η κινεζική εταιρεία δημιουργίας τεχνητής νοημοσύνης (AI) DeepSeek υιοθέτησε καινοτόμες τεχνικές για την ανάπτυξη ενός μοντέλου που εκπαιδεύτηκε με περιορισμένη ανθρώπινη παρέμβαση, ωθώντας σε μια ερίγδουπη εμφάνιση, που προκάλεσε πανικό στις αγορές και θα μπορούσε να μετασχηματίσει το κόστος που απαιτείται ώστε οι προγραμματιστές να δημιουργήσουν εφαρμογές με βάση την τεχνολογία.

Το έγγραφο που δημοσιεύθηκε σχετικά με τη λειτουργία του μοντέλου «συλλογιστικής» R1 της DeepSeek αποκαλύπτει πώς η ομάδα, με επικεφαλής τον δισεκατομμυριούχο του hedge fund Λιάνγκ Γουένφενγκ, πέτυχε σε μεγάλο βαθμό να εξαλείψει πολλά εμπόδια στην ανάπτυξη της τεχνητής νοημοσύνης. Το έγγραφο δείχνει πώς η DeepSeek υιοθέτησε μια σειρά από πιο αποτελεσματικές τεχνικές για την ανάπτυξη του R1, το οποίο, όπως και το αντίπαλο μοντέλο o1 της OpenAI, παράγει ακριβείς απαντήσεις «σκεπτόμενο» βήμα προς βήμα τις απαντήσεις του για μεγαλύτερο χρονικό διάστημα από ό,τι τα περισσότερα μεγάλα γλωσσικά μοντέλα.

Τα επιτεύγματα της DeepSeek προέρχονται από τη χρήση της «μάθησης μέσω ενίσχυσης» (RL) για τη μείωση της ανθρώπινης συμμετοχής στην παραγωγή απαντήσεων σε προτροπές. Η εταιρεία έχει επίσης δημιουργήσει μικρότερα μοντέλα με λιγότερες παραμέτρους - τον αριθμό των μεταβλητών που χρησιμοποιούνται για την εκπαίδευση ενός συστήματος τεχνητής νοημοσύνης και τη διαμόρφωση της παραγωγής του - με ισχυρές ικανότητες συλλογισμού, βελτιώνοντας μεγάλα μοντέλα που εκπαιδεύονται από ανταγωνιστές όπως η Meta και η Alibaba. Μαζί, αυτές οι εξελίξεις έχουν προκαλέσει σοκ σε όλη τη Silicon Valley, καθώς το R1 υπερτερεί σε ορισμένες εργασίες σε σύγκριση με τα μοντέλα που κυκλοφόρησαν πρόσφατα από την OpenAI, την Anthropic και τη Meta, αλλά με ένα κλάσμα των χρημάτων για την ανάπτυξή τους.

«Νομίζω ότι είναι μόνο η κορυφή του παγόβουνου όσον αφορά το είδος της καινοτομίας που μπορούμε να περιμένουμε σε αυτά τα μοντέλα», δήλωσε ο Neil Lawrence, καθηγητής μηχανικής μάθησης της DeepMind στο πανεπιστήμιο του Cambridge. «Η ιστορία δείχνει ότι οι μεγάλες επιχειρήσεις δυσκολεύονται να καινοτομήσουν καθώς κλιμακώνονται, και αυτό που έχουμε δει από πολλές από αυτές τις μεγάλες επιχειρήσεις είναι η αντικατάσταση της πνευματικής σκληρής δουλειάς από επενδύσεις σε υπολογιστές».

Τα σταδιακά βήματα και η εμφατική παρουσίαση

Τα μεγάλα γλωσσικά μοντέλα κατασκευάζονται σε δύο στάδια. Το πρώτο ονομάζεται «προ-εκπαίδευση», κατά το οποίο οι προγραμματιστές χρησιμοποιούν τεράστια σύνολα δεδομένων που βοηθούν τα μοντέλα να προβλέψουν την επόμενη λέξη σε μια πρόταση. Το δεύτερο στάδιο ονομάζεται «μετεκπαίδευση», μέσω της οποίας οι προγραμματιστές μαθαίνουν στο μοντέλο να ακολουθεί οδηγίες, όπως η επίλυση μαθηματικών προβλημάτων ή η κωδικοποίηση. Ένας τρόπος για να κάνουν τα chatbots να παράγουν πιο χρήσιμες απαντήσεις ονομάζεται «μάθηση μέσω ενίσχυσης από ανθρώπινη ανατροφοδότηση» (RLHF), μια τεχνική που εφαρμόστηκε από την OpenAI για τη βελτίωση του ChatGPT. Η RLHF λειτουργεί με ανθρώπινους σχολιαστές που επισημαίνουν τις απαντήσεις του μοντέλου τεχνητής νοημοσύνης σε προτροπές και επιλέγουν τις απαντήσεις που είναι καλύτερες. Αυτό το βήμα είναι συχνά επίπονο, ακριβό και χρονοβόρο, απαιτώντας συχνά έναν μικρό στρατό ανθρώπινων μαρκαδόρων δεδομένων. Η μεγάλη καινοτομία της DeepSeek είναι η αυτοματοποίηση αυτού του τελικού βήματος, χρησιμοποιώντας μια τεχνική που ονομάζεται ενισχυτική μάθηση (RL), κατά την οποία το μοντέλο ΤΝ ανταμείβεται επειδή κάνει το σωστό.

Η DeepSeek ανέπτυξε πρώτα ένα ισχυρό μοντέλο πρόβλεψης κειμένου που ονομάζεται V3. Στη συνέχεια χρησιμοποίησε RL για να «ανταμείψει» το μοντέλο, όπως για παράδειγμα να του δώσει ένα μπράβο για την παραγωγή της σωστής απάντησης. Η κινεζική εταιρεία διαπίστωσε ότι κάνοντας αυτή τη διαδικασία αρκετές φορές, το μοντέλο κατάφερε να λύσει αυθόρμητα προβλήματα χωρίς ανθρώπινη επίβλεψη. Αυτή η τεχνική χρησιμοποιήθηκε επίσης από την Google DeepMind για την κατασκευή του AlphaGo, του συστήματος τεχνητής νοημοσύνης που νίκησε τους ανθρώπινους παίκτες στο αρχαίο επιτραπέζιο παιχνίδι Go και έδωσε το έναυσμα για τη σημερινή έκρηξη των υπολογιστικών τεχνικών βαθιάς μάθησης πριν από σχεδόν μια δεκαετία. Η DeepSeek δήλωσε «εύρηκα» όταν επαναξιολόγησε τις απαντήσεις του και προσάρμοσε τον χρόνο επεξεργασίας του για την επίλυση διαφορετικών ερωτήσεων. «Η στιγμή που αναφωνήσαμε 'εύρηκα' χρησιμεύει ως μια έντονη υπενθύμιση των δυνατοτήτων της [RL] να ξεκλειδώσει νέα επίπεδα νοημοσύνης στα συστήματα τεχνητής νοημοσύνης, ανοίγοντας τον δρόμο για πιο αυτόνομα και ευπροσάρμοστα μοντέλα στο μέλλον», έγραψαν οι δημιουργοί της DeepSeek στο έγγραφο.

Ο Lewis Tunstall, ερευνητής στη Hugging Face, μια εταιρεία ερευνών τεχνητής νοημοσύνης, δήλωσε: «Φαίνεται ότι η μυστική σάλτσα για να δουλέψει αυτό είναι να έχεις ένα πολύ, πολύ ισχυρό προ-εκπαιδευμένο μοντέλο και στη συνέχεια να έχεις πολύ, πολύ καλή υποδομή για να κάνεις αυτή τη διαδικασία ενισχυτικής μάθησης σε μεγάλη κλίμακα».

Μικρά μοντέλα που κατασκευάζονται χρησιμοποιώντας μεγάλα

Ενώ η OpenAI και η Google επενδύουν δισεκατομμύρια δολάρια για την κατασκευή μεγάλων γλωσσικών μοντέλων, η DeepSeek έχει επίσης κατασκευάσει μικρότερα μοντέλα που μπορούν να εκτελούνται σε τηλέφωνα ή προγράμματα περιήγησης στο διαδίκτυο, "αποστάζοντας" τις δυνατότητες συλλογισμού των μεγαλύτερων μοντέλων.

Η DeepSeek χρησιμοποίησε το μοντέλο R1 για να δημιουργήσει ένα σχετικά μικρό σύνολο 800.000 σημείων δεδομένων και στη συνέχεια βελτίωσε τα μοντέλα που κατασκευάστηκαν από ανταγωνιστές όπως το Qwen της Alibaba και το Llama της Meta χρησιμοποιώντας αυτά τα δεδομένα που δημιούργησε η τεχνητή νοημοσύνη. Η DeepSeek διαπίστωσε ότι αυτά τα αποσταγμένα μοντέλα ήταν ιδιαίτερα ισχυρά σε συγκριτικά κριτήρια συλλογισμού, σε ορισμένες περιπτώσεις ξεπερνώντας μοντέλα-ναυαρχίδες όπως το Claude της Anthropic. "Βασικά μπορεί να λύσει τα περισσότερα από τα μαθηματικά προβλήματα που έκανα στις προπτυχιακές σπουδές μου", δήλωσε ο Tunstall.

Αυτή η εξέλιξη θα μπορούσε να είναι μια ευλογία για τους προγραμματιστές εφαρμογών, οι οποίοι έχουν έναν φθηνό και αποτελεσματικό τρόπο να κατασκευάζουν προϊόντα. Η διδασκαλία των μοντέλων τεχνητής νοημοσύνης να συλλογίζονται κατά τη διάρκεια της «συμπερασματολογίας» - όταν το μοντέλο παράγει απαντήσεις - είναι πολύ πιο αποτελεσματική από τη διαδικασία προ-εκπαίδευσης, η οποία απαιτεί μεγάλη υπολογιστική ισχύ, σύμφωνα με τον Lennart Heim, ερευνητή στη Rand, μια δεξαμενή σκέψης.

Αυτό το νέο παράδειγμα θα μπορούσε να επιτρέψει στους ανταγωνιστές να κατασκευάσουν ανταγωνιστικά μοντέλα με πολύ λιγότερη υπολογιστική ισχύ και χρήματα, πρόσθεσε. Ωστόσο, χωρίς χρήματα για τσιπ, "απλά δεν μπορούν να τα αναπτύξουν στην ίδια κλίμακα", δήλωσε ο Heim.Η DeepSeek δεν δήλωσε πόσα δαπάνησε για την κατασκευή του R1, αλλά ισχυρίστηκε ότι εκπαίδευσε το μοντέλο V3, στο οποίο βασίζεται το R1, με μόλις 5,6 εκατ. δολάρια. Το ποσό αυτό δεν περιλαμβάνει άλλα κόστη, όπως η πιθανή απόκτηση χιλιάδων μονάδων επεξεργασίας γραφικών για την εκπαίδευση του μοντέλου, ούτε μισθούς, πειράματα, εκπαίδευση και ανάπτυξη, δήλωσε ο Heim.

Και ενώ η DeepSeek ήταν η πρώτη που χρησιμοποίησε τις συγκεκριμένες τεχνικές της, άλλα εργαστήρια τεχνητής νοημοσύνης αναμένεται να ακολουθήσουν το παράδειγμά της, με τη Hugging Face να εργάζεται ήδη για την αντιγραφή της R1. Οι αμερικανικές εταιρείες τεχνητής νοημοσύνης έχουν επίσης εργαστεί για τη χρήση των δυνατοτήτων των μεγάλων, υπερσύγχρονων μοντέλων τους σε μικρότερα, πιο ευέλικτα μοντέλα. Η Google λάνσαρε πέρυσι το Gemma, το οποίο είναι ένα πιο ελαφρύ μοντέλο βασισμένο στο δικό της Gemini.«Η συνταγή της νοημοσύνης είναι αρκετά απλή», λέει ο Thomas Wolf, συνιδρυτής και επιστημονικός υπεύθυνος της Hugging Face, προσθέτοντας ότι οι τεχνικές της DeepSeek ήταν καλά κατανοητές από άλλους στον τομέα. «Και γι' αυτό περιμένω ότι πολλές ομάδες μπορούν να το ξανακάνουν αυτό».

Με πληροφορίες από Financial Times

Διεθνή

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Διεθνή / Ποια είναι η DeepSeek που έφερε πανικό στη Wall Street

Οι συγκρίσεις με την OpenAI - Οι συζητήσεις για τον αντίκτυπο

LIFO NEWSROOM

29.1.2025

Διεθνή / «Κάν΄το όπως το Temu»: Πώς η DeepSeek ανέτρεψε τα δεδομένα με το γνωστό κινεζικό μοντέλο

Η ανακοίνωση της DeepSeek οδήγησε σε μείωση της χρηματιστηριακής αξίας της Nvidia κατά σχεδόν $600 δισ., περισσότερο από την αξία εταιρειών όπως η Mastercard και η Exxon Mobil

LIFO NEWSROOM

28.1.2025

Τech & Science / Λιανγκ Γουένφενγκ: Ποιος είναι ο άνθρωπος πίσω από την DeepSeek που εκθρόνισε το ChatGPT

Η DeepSeek αναστάτωσε τις διεθνείς αγορές με το chatbot της, αλλά ο CEO της είναι ένας επιχειρηματίας χαμηλών τόνων που δεν έχει υπόβαθρο στην τεχνητή νοημοσύνη

LIFO NEWSROOM

28.1.2025

DeepSeek: Σε μία μέρα χάθηκε 1 τρισ. δολαρίων στη Wall Street

Διεθνή / DeepSeek: Σε μία ημέρα χάθηκε 1 τρισ. δολαρίων στη Wall Street

Η εμφάνιση της DeepSeek και η διαπίστωση ότι οι ΗΠΑ χάνουν την παγκόσμια κυριαρχία στον τομέα της τεχνητής νοημοσύνης έφερε κατάρρευση της Nvidia και των fund που συνδέονται με το ΑΙ

LIFO NEWSROOM

28.1.2025

ΔΕΙΤΕ ΑΚΟΜΑ

Διεθνή / Πρόωρο κύμα καύσωνα στη Γαλλία: Πώς η παρατεταμένη ζέστη επηρεάζει το σώμα

Οι γιατροί προειδοποιούν ότι η ακραία ζέστη μπορεί να οδηγήσει σε αφυδάτωση, θερμοπληξία και σοβαρές βλάβες στον οργανισμό, ιδιαίτερα στους ηλικιωμένους

Τα σταδιακά βήματα και η εμφατική παρουσίαση

Μικρά μοντέλα που κατασκευάζονται χρησιμοποιώντας μεγάλα

Tags

ΕΓΓΡΑΦΕΙΤΕ ΣΤΟ NEWSLETTER ΜΑΣ

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Διεθνή / Ποια είναι η DeepSeek που έφερε πανικό στη Wall Street

Διεθνή / «Κάν΄το όπως το Temu»: Πώς η DeepSeek ανέτρεψε τα δεδομένα με το γνωστό κινεζικό μοντέλο

Τech & Science / Λιανγκ Γουένφενγκ: Ποιος είναι ο άνθρωπος πίσω από την DeepSeek που εκθρόνισε το ChatGPT

Διεθνή / DeepSeek: Σε μία ημέρα χάθηκε 1 τρισ. δολαρίων στη Wall Street

ΔΙΑΒΑΖΟΝΤΑΙ ΤΩΡΑ

Το αποκαλυπτικό βίντεο με το πώς ξεκίνησε το επεισόδιο μεταξύ Μαρινάκη και Δημητριάδη

Το plan b της Ευρώπης για το Grexit με την ονομασία «Κωδικός Αλβανία» - Οι συνέπειες στο εθνικό νόμισμα

«Ο κόσμος ούρλιαζε»: Δέκα τραυματίες σε πτήση προς Χονγκ Κονγκ μετά από σφοδρές αναταράξεις

Γαλλία: Τραπεζίτης εξέδωσε τη σύντροφό του σε πάνω από 500 άνδρες - Καταδικάστηκε σε 25 χρόνια κάθειρξης

Σπάνιο «τροπικό δάσος» της Ευρώπης επιστρέφει στη ζωή μετά από αιώνες

Χολαργός: Άνδρας πυροβόλησε τη σύζυγό του και αυτοκτόνησε

ΔΕΙΤΕ ΑΚΟΜΑ

Διεθνή / Πρόωρο κύμα καύσωνα στη Γαλλία: Πώς η παρατεταμένη ζέστη επηρεάζει το σώμα

Διεθνή / Νετανιάχου για Λίβανο: «Ζήτησα να εντείνουμε τα πλήγματα κατά της Χεζμπολάχ»

Διεθνή / «Ο κόσμος ούρλιαζε»: Δέκα τραυματίες σε πτήση προς Χονγκ Κονγκ μετά από σφοδρές αναταράξεις

Διεθνή / Χανταϊός: Επιβεβαιώθηκε δεύτερο κρούσμα στην Ισπανία

Διεθνή / Βασίλισσα Μαργαρίτα: Ξανά στο νοσοκομείο μετά τον εντοπισμό θρόμβου

Διεθνή / Ακραία ζέστη σε Γαλλία, Ισπανία και Βρετανία με νέα ρεκόρ για τον Μάιο

Διεθνή / Η Αν Χάθαγουεϊ αποκάλυψε ότι έπασχε από πρόωρο καταρράκτη: «Ήμουν μισότυφλη επί 10 χρόνια»

Διεθνή / Βραζιλία: Ο Λούλα υποβάλλεται σε προληπτική ακτινοθεραπεία μετά την αφαίρεση καρκίνου του δέρματος

Διεθνή / Γαλλία: Τραπεζίτης εξέδωσε τη σύντροφό του σε πάνω από 500 άνδρες - Καταδικάστηκε σε 25 χρόνια κάθειρξης

Διεθνή / Έμπολα στο Κονγκό: Συγγενείς προσπάθησαν να πάρουν σορούς από νοσοκομείο - Πυροβολισμοί από την αστυνομία

Διεθνή / «AI face»: Πλαστικοί χειρουργοί προειδοποιούν για τις μη ρεαλιστικές απαιτήσεις ασθενών

Διεθνή / Μοτζτάμπα Χαμενεΐ: «Χρειάστηκε μόνο ένα ή δύο ράμματα», σύμφωνα με το υπουργείο Υγείας του Ιράν

Διεθνή / Ρωσία: Προειδοποίηση για εκκένωση του Κιέβου - «Θα χτυπήσουμε κέντρα λήψης αποφάσεων»

Διεθνή / Ο πατέρας του Στίβεν Χόκινγκ ανησυχούσε ότι ο γιος του ήταν «τεμπέλης»

Διεθνή / Αυτοκίνητο έπεσε πάνω σε ελέφαντα στην Ουγκάντα - Τουλάχιστον τρεις νεκροί

Διεθνή / Πορτογαλία: Ο πατέρας των παιδιών που εγκαταλείφθηκαν στον δρόμο ζητά διακριτικότητα

Διεθνή / Γκάμπορ Ματέ: «Τα smartphones είναι σχεδιασμένα να ανεβάζουν την ντοπαμίνη, όπως η κοκαΐνη»

Διεθνή / Θερμικός θόλος στην Ευρώπη: «Πρωτοφανές το κύμα καύσωνα» - Πού έχει σημάνει κίτρινος συναγερμός

Διεθνή / Φειδίας Παναγιώτου: Αποφάσισε τι θα κάνει με το Ευρωκοινοβούλιο και τη βουλευτική έδρα στην Κύπρο

Διεθνή / Ο Πάπας Λέων ΙΔ΄ κάνει την τεχνητή νοημοσύνη θρησκευτικό ζήτημα στην πρώτη του εγκύκλιο