Γιατί οι κινεζικές εταιρείες AI προηγούνται στη δημιουργία βίντεο

ΚΙΝΑ ΗΠΑ AI ΤΕΧΝΗΤΗ ΝΟΥΜΟΣΗΝΗ Facebook Twitter
Φωτογραφίες που δημιουργήθηκαν με το κινεζικό ΑΙ μοντέλο Kuaishou
0

Οι κινεζικές εταιρείες τεχνητής νοημοσύνης φαίνεται να αποκτούν προβάδισμα έναντι των αμερικανικών ανταγωνιστών τους στον ταχέως αναπτυσσόμενο τομέα της δημιουργίας βίντεο μέσω AI, έναν κλάδο που εξελίσσεται σε κρίσιμο πεδίο ανταγωνισμού για τη generative AI.

Σύμφωνα με δημιουργούς περιεχομένου, προγραμματιστές και ανεξάρτητες πλατφόρμες αξιολόγησης μοντέλων, κινεζικά συστήματα όπως το Kling της Kuaishou, το Seedance 2.0 της ByteDance και το Hailuo της MiniMax εμφανίζουν καλύτερες επιδόσεις στην παραγωγή βίντεο σε σχέση με αντίστοιχα εργαλεία αμερικανικών εταιρειών.

Η εξέλιξη αυτή αποτυπώνει μια διαφοροποίηση στην παγκόσμια κούρσα της τεχνητής νοημοσύνης. Ενώ εταιρείες όπως η OpenAI, η Google και η Anthropic εξακολουθούν να κυριαρχούν στα μεγάλα γλωσσικά μοντέλα και σε τομείς όπως ο προγραμματισμός, οι κινεζικές πλατφόρμες φαίνεται να προηγούνται στην παραγωγή βίντεο τόσο σε ποιότητα όσο και σε λειτουργικότητα.

Το μεγάλο πλεονέκτημα των κινεζικών εταιρειών ΑΙ

Αναλυτές αποδίδουν το πλεονέκτημα αυτό στην τεράστια ποσότητα βιντεοληπτικού υλικού που διαθέτουν κινεζικοί τεχνολογικοί όμιλοι μέσω εφαρμογών σύντομων βίντεο όπως το TikTok και οι αντίστοιχες κινεζικές πλατφόρμες.

Η εκπαίδευση μοντέλων δημιουργίας βίντεο απαιτεί πολύ μεγαλύτερο όγκο δεδομένων σε σχέση με τα γλωσσικά μοντέλα κειμένου, ενώ η πρόσβαση σε μεγάλες βιβλιοθήκες οπτικού περιεχομένου θεωρείται κρίσιμο ανταγωνιστικό πλεονέκτημα.

Ο Μπεν Τσιάνγκ, ιδρυτής της startup Director AI που παράγει κινούμενα σχέδια και σύντομα δράματα μέσω AI, δήλωσε ότι τα περισσότερα αμερικανικά μοντέλα που δοκίμασε «δεν είναι ιδιαίτερα καλά στην παραγωγή βίντεο».

Όπως ανέφερε, η εταιρεία του χρησιμοποιεί κυρίως το Kling της Kuaishou, αλλά και τα μοντέλα της ByteDance και της MiniMax, ανάλογα με το κόστος και το είδος του περιεχομένου.

«Το βασικό είναι η ποιότητα και το πόσο σωστά ακολουθεί το μοντέλο τις οδηγίες του χρήστη», σημείωσε.

Για πολλούς δημιουργούς ψηφιακού περιεχομένου, οι πρόσφατες βελτιώσεις στα κινεζικά μοντέλα αλλάζουν ήδη τον τρόπο παραγωγής βίντεο, καθώς τα εργαλεία εμφανίζονται πιο σταθερά σε σκηνές με γρήγορη κίνηση, σύνθετες γωνίες λήψης και συγχρονισμό ήχου.

Ο ανεξάρτητος δημιουργός ταινιών AI Τζορτζ Γουόν δήλωσε ότι το Seedance 2.0 της ByteDance του προσφέρει «πολύ μεγαλύτερη δημιουργική ελευθερία», ειδικά σε σκηνές με έντονη κίνηση κάμερας.

«Τα περισσότερα μοντέλα αρχίζουν να χάνουν τη συνοχή της εικόνας όταν η σκηνή γίνεται γρήγορη ή περίπλοκη», ανέφερε.

«Περιοριστικά» χαρακτηρίζονται τα αμερικανικά AI μοντέλα

Τα μοντέλα Kling, Seedance 2.0 και HappyHorse 1.0 συγκαταλέγονται πλέον στις υψηλότερες θέσεις ανεξάρτητων rankings για εργαλεία παραγωγής βίντεο μέσω AI. Αντίστοιχα, το Veo 3 της Google θεωρείται από τα ελάχιστα αμερικανικά μοντέλα που παραμένουν ανταγωνιστικά, κυρίως λόγω της πρόσβασης της Google στη μεγάλη βιβλιοθήκη βίντεο του YouTube.

Ωστόσο, αρκετοί προγραμματιστές υποστηρίζουν ότι τα αμερικανικά εργαλεία είναι πολύ πιο περιοριστικά ως προς το περιεχόμενο που επιτρέπουν.

Ο Μπεν Τσιάνγκ ανέφερε ότι τα αμερικανικά μοντέλα «μπλοκάρουν συνεχώς αιτήματα» επικαλούμενα παραβιάσεις όρων χρήσης χωρίς να δίνουν σαφείς εξηγήσεις, γεγονός που δυσκολεύει σημαντικά τη δημιουργική διαδικασία.

Παράλληλα, η ταχεία ανάπτυξη των κινεζικών εργαλείων έχει προκαλέσει και νομικές αντιδράσεις. Η ByteDance έχει δεχθεί απειλές για προσφυγές σχετικά με πιθανές παραβιάσεις πνευματικών δικαιωμάτων, καθώς χρήστες δημιούργησαν βίντεο με χαρακτήρες από ταινίες της Marvel και τη σειρά South Park χωρίς σχετική άδεια.

Η εταιρεία έχει δηλώσει ότι θα ενισχύσει τα μέτρα προστασίας πνευματικών δικαιωμάτων στις πλατφόρμες της.

Με πληροφορίες από Financial Times

Τech & Science
0

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

ΔΕΙΤΕ ΑΚΟΜΑ

ΠΙΤ ΧΕΓΚΣΕΘ AI ΠΕΝΤΑΓΩΝΟ ANTHROPIC CLAUDE

Τech & Science / Politico: Το Πεντάγωνο θέλει να αξιοποιήσει και να «οπλίσει» νέα AI μοντέλα κυβερνοπολέμου

Στο επίκεντρο βρίσκεται το Claude Mythos Preview της Anthropic, ένα μοντέλο που φέρεται να διαθέτει ιδιαίτερα εξελιγμένες δυνατότητες στον εντοπισμό ψηφιακών ευπαθειών και στην εκτέλεση σύνθετων ενεργειών hacking
THE LIFO TEAM
ΑΝΟΙΑ ΚΑΚΗ ΣΥΝΗΘΕΙΑ ΔΙΑΚΟΠΗ

Τech & Science / Η διακοπή αυτής της κακής συνήθειας ίσως συνδέεται με μειωμένο κίνδυνο εμφάνισης άνοιας

Οι ερευνητές επισημαίνουν πως η μελέτη αυτή καταδεικνύει μόνο μια συσχέτιση και δεν αποδεικνύει ότι η διακοπή αυτής της συνήθειας μειώνει τον κίνδυνο άνοιας και γνωστικής εξασθένησης
THE LIFO TEAM
ΣΜΝ ΓΟΝΟΡΡΟΙΑ ΣΥΦΙΛΗ

Τech & Science / Σε ιστορικό υψηλό τα ΣΜΝ στην Ευρώπη: Ρεκόρ κρουσμάτων γονόρροιας και σύφιλης

Οι ειδικοί προειδοποιούν ότι, αν δεν αντιμετωπιστούν, οι λοιμώξεις αυτές μπορεί να προκαλέσουν σοβαρές επιπλοκές, όπως χρόνιο πόνο, υπογονιμότητα και, στην περίπτωση της σύφιλης, προβλήματα στην καρδιά και το νευρικό σύστημα
THE LIFO TEAM
ΕΜΠΟΛΑ ΙΟΣ ΚΟΝΓΚΟ

Τech & Science / Γιατί είναι τόσο δύσκολο να περιοριστεί η τελευταία έξαρση του ιού Έμπολα;

Το συγκεκριμένο ξέσπασμα στη Λαϊκή Δημοκρατία του Κονγκό οφείλεται στο σπάνιο στέλεχος Bundibugyo, το οποίο είχε να εμφανιστεί πάνω από μία δεκαετία και έχει προκαλέσει μόνο δύο προηγούμενες επιδημίες
THE LIFO TEAM
Το FaceTime είδε γυμνό και πάγωσε τη στιγμή για ζευγάρια από απόσταση

Τech & Science / Το FaceTime είδε γυμνό και πάγωσε τη στιγμή για ζευγάρια από απόσταση

Η λειτουργία Sensitive Content Warning της Apple, που θολώνει πιθανό γυμνό σε FaceTime, Messages και AirDrop, έχει γίνει viral στα social media, με χρήστες να λένε ότι τους διέκοψε σε απολύτως συναινετικές στιγμές με τους συντρόφους τους
THE LIFO TEAM