Ένα πρόγραμμα τεχνητής νοημοσύνης «τραγουδά» τις φωτογραφίες σας

Ένα πρόγραμμα τεχνητής νοημοσύνης «τραγουδά» τις φωτογραφίες σας Facebook Twitter
0

Ένα πρωτότυπο πρόγραμμα αναπτύχθηκε από το Πανεπιστήμιο του Τορόντο, το οποίο αποτελεί μία ευφάνταστη επίδειξη του τι μπορεί να καταφέρει η τεχνητή νοημοσύνη, πέρα από το να δώσει φωνή σε ένα chatbot ή να «εξαφανίσει» δισεκατομμύρια από το χρηματιστήριο.


Το «Neural Karaoke» είναι ένα πρόγραμμα τεχνητής νοημοσύνης, το οποίο μπορεί να πάρει οποιαδήποτε ψηφιακή φωτογραφία και να δημιουργήσει για αυτήν ένα τραγούδι, γράφοντας από την αρχή τους στίχους και τη μουσική. Δεν αναμένεται να γράψει σύντομα κάποιο «χιτ», αλλά στο παράδειγμα που παρουσιάζεται στο παρακάτω βίντεο, διακρίνονται οι δυνατότητές του, δεδομένου ότι κανένας άνθρωπος δεν βοήθησε στη δημιουργία του τραγουδιού.

«Έχουμε συνηθίσει να σκεφτόμαστε την τεχνητή νοημοσύνη για πράγματα που αφορούν κυρίως τη ρομποτική. Το ερώτημα πλέον είναι τι μπορεί να κάνει η AI για εμάς;», δήλωσε στη βρετανική εφημερίδα Guardian η Raquel Urtasun, αναπληρώτρια καθηγήτρια και μέλος της ομάδας ανάπτυξης του προγράμματος.


«Μπορείτε να φανταστείτε ένα κανάλι AI στο Spotify να παράγει μουσική ή να "βλέπει" τις φωτογραφίες ανθρώπων και να τραγουδά αποκλειστικά για αυτές; Πρόκειται για το τι μπορεί να κάνει στις μέρες μας η Βαθιά Μάθηση ώστε να γίνει η ζωή μας πιο διασκεδαστική», πρόσθεσε η συνάδελφός της, Sanja Fidler.


Το Neural Karaoke προέκυψε κατά τη διάρκεια μιας ευρύτερης προσπάθειας ερευνητών να χρησιμοποιήσουν προγράμματα υπολογιστών προκειμένου να συνθέσουν μουσική, να γράψουν στίχους ή ακόμα και να δημιουργήσουν χορογραφίες.


Χρησιμοποιώντας τη δημιουργία μουσικής ως σημείο εκκίνησης, ο διδακτορικός φοιτητής Hang Chu εκπαίδευσε ένα νευρωνικό δίκτυο με 100 ώρες μουσικής. Αφότου το πρόγραμμα εκπαιδεύτηκε, μπόρεσε να πάρει μια μουσική κλίμακα και ένα μελωδικό προφίλ και να δημιουργήσει μια απλή μελωδία.


Ωστόσο, η σύνθεση μουσικής ήταν μόνο η αρχή. Η ομάδα του πανεπιστημίου του Τορόντο εκπαίδευσε στη συνέχεια το πρόγραμμα να χορεύει. Αφού «παρακολούθησε» χορογραφίες μιας ώρας από το παιχνίδι Just Dance, το πρόγραμμα κατάφερε να εντοπίσει τις στάσεις του ανθρώπινου σώματος, και έμαθε να συνδέει τις κινήσεις με τη μουσική. Βέβαια, το αποτέλεσμα ήταν ερασιτεχνικό, ωστόσο κανείς δεν μπορεί να περιμένει τις κινήσεις του Τραβόλτα με μία και μόνο ώρα μαθήματος, σχολιάζει η Guardian. 


Μία ακόμα ώρα με μελωδίες από το Just Dance και 50 ώρες ανάγνωσής στίχων από το Ίντερνετ, βοήθησαν ώστε το πρόγραμμα να μάθει πώς να βάζει λέξεις στη μουσική. Συλλέγοντας λέξεις που εμφανίζονταν τουλάχιστον τέσσερις φορές, το πρόγραμμα «έχτισε» ένα λεξιλόγιο 3.390 λέξεων.


Για το τελικό στάδιο, το Neural Karaoke εκπαιδεύτηκε με μια σειρά από εικόνες και λεζάντες και έμαθε πώς συγκεκριμένες λέξεις μπορούν να συνδεθούν με οπτικά μοτίβα και αντικείμενα. Όταν «δει» μια καινούρια εικόνα έχει τη δυνατότητα να βρει σχετικούς στίχους και να τους τραγουδήσει.


Η ομάδα του Τορόντο αναφέρει ότι σε επόμενες αναβαθμίσεις το πρόγραμμα θα είναι σε θέση να δημιουργήσει πιο πολύπλοκα τραγούδια, καθώς και να επιλέξει τα καλύτερα μουσικά όργανα για μια εικόνα. Μάλιστα, αναφέρουν πως μία πιο εξελιγμένη έκδοση μπορεί μια μέρα να χρησιμοποιηθεί για να εκπαιδεύσει μελλοντικούς συμμετέχοντες σε διαγωνισμούς τραγουδιού, όπως το X Factor, αν και πιο πριν θα χρησιμοποιηθεί για διασκέδαση στο σπίτι. 


«Αντί να αγοράσει κάποιος ένα μηχάνημα καραόκε, το οποίο θα περιλαμβάνει συγκεκριμένα τραγούδια, θα μπορούσε να δημιουργήσει τη δική του μουσική καραόκε στο σπίτι, προσθέτοντας μερικές ενδιαφέρουσες φωτογραφίες και αφήνοντας το πρόγραμμα να συνθέσει μουσική ειδικά για τον χρήστη», δήλωσε στη Guardian η Fidler. «Πιστεύω ότι οι δυνατότητες είναι απεριόριστες», πρόσθεσε.

Πηγές: Guardian/ΑΠΕ-ΜΠΕ

0

ΔΕΙΤΕ ΑΚΟΜΑ

ΠΙΤ ΧΕΓΚΣΕΘ AI ΠΕΝΤΑΓΩΝΟ ANTHROPIC CLAUDE

Τech & Science / Politico: Το Πεντάγωνο θέλει να αξιοποιήσει και να «οπλίσει» νέα AI μοντέλα κυβερνοπολέμου

Στο επίκεντρο βρίσκεται το Claude Mythos Preview της Anthropic, ένα μοντέλο που φέρεται να διαθέτει ιδιαίτερα εξελιγμένες δυνατότητες στον εντοπισμό ψηφιακών ευπαθειών και στην εκτέλεση σύνθετων ενεργειών hacking
THE LIFO TEAM
ΑΝΟΙΑ ΚΑΚΗ ΣΥΝΗΘΕΙΑ ΔΙΑΚΟΠΗ

Τech & Science / Η διακοπή αυτής της κακής συνήθειας ίσως συνδέεται με μειωμένο κίνδυνο εμφάνισης άνοιας

Οι ερευνητές επισημαίνουν πως η μελέτη αυτή καταδεικνύει μόνο μια συσχέτιση και δεν αποδεικνύει ότι η διακοπή αυτής της συνήθειας μειώνει τον κίνδυνο άνοιας και γνωστικής εξασθένησης
THE LIFO TEAM
ΣΜΝ ΓΟΝΟΡΡΟΙΑ ΣΥΦΙΛΗ

Τech & Science / Σε ιστορικό υψηλό τα ΣΜΝ στην Ευρώπη: Ρεκόρ κρουσμάτων γονόρροιας και σύφιλης

Οι ειδικοί προειδοποιούν ότι, αν δεν αντιμετωπιστούν, οι λοιμώξεις αυτές μπορεί να προκαλέσουν σοβαρές επιπλοκές, όπως χρόνιο πόνο, υπογονιμότητα και, στην περίπτωση της σύφιλης, προβλήματα στην καρδιά και το νευρικό σύστημα
THE LIFO TEAM
ΕΜΠΟΛΑ ΙΟΣ ΚΟΝΓΚΟ

Τech & Science / Γιατί είναι τόσο δύσκολο να περιοριστεί η τελευταία έξαρση του ιού Έμπολα;

Το συγκεκριμένο ξέσπασμα στη Λαϊκή Δημοκρατία του Κονγκό οφείλεται στο σπάνιο στέλεχος Bundibugyo, το οποίο είχε να εμφανιστεί πάνω από μία δεκαετία και έχει προκαλέσει μόνο δύο προηγούμενες επιδημίες
THE LIFO TEAM
Το FaceTime είδε γυμνό και πάγωσε τη στιγμή για ζευγάρια από απόσταση

Τech & Science / Το FaceTime είδε γυμνό και πάγωσε τη στιγμή για ζευγάρια από απόσταση

Η λειτουργία Sensitive Content Warning της Apple, που θολώνει πιθανό γυμνό σε FaceTime, Messages και AirDrop, έχει γίνει viral στα social media, με χρήστες να λένε ότι τους διέκοψε σε απολύτως συναινετικές στιγμές με τους συντρόφους τους
THE LIFO TEAM
COLOSSAL BIOSCIENCES ΚΟΤΟΠΟΥΛΑ ΑΥΓΑ

Τech & Science / Εταιρεία που θέλει να επαναφέρει το μαμούθ ανακοίνωσε ότι εκκόλαψε κοτόπουλα σε τεχνητά αυγά

Η εταιρεία μιλά για ένα νέο βήμα για τη «νεκρανάσταση» εξαφανισμένων ειδών, με στόχο η τεχνολογία να χρησιμοποιηθεί για τη δημιουργία πτηνών που θα μοιάζουν με το γιγαντιαίο moa της Νέας Ζηλανδίας
THE LIFO TEAM
Η Google θέλει να βάλει έναν AI βοηθό σε κάθε μικρή στιγμή της ημέρας σου

Τech & Science / Η Google θέλει να βάλει έναν AI βοηθό σε κάθε μικρή στιγμή της ημέρας σου

Στο Google I/O, η εταιρεία παρουσίασε το Gemini Spark, έναν AI βοηθό που θα οργανώνει email, σημειώσεις, αγορές και αναζητήσεις στο παρασκήνιο μαζί με νέα εργαλεία βίντεο και την επιστροφή των έξυπνων γυαλιών.
THE LIFO TEAM