Το DeepMind, το ερευνητικό εργαστήριο Τεχνητής Νοημοσύνης της Google, πλέον μπορεί να δημιουργεί και soundtracks για τις ταινίες που παράγει. Αν και ακούγεται λογικό, αποδείχθηκε ότι στην πράξη η υλοποίηση αυτού του εγχειρήματος δεν ήταν απλή υπόθεση.
Παρόλο που πολλές εταιρείες, όπως η OpenAI, η Adobe, η Microsoft, και διάφορα άλλα εργαλεία όπως το Dream Machine της Luma Labs, έχουν ήδη δείξει ότι μπορούν να δημιουργήσουν βίντεο, η δημιουργία κατάλληλης μουσικής επένδυσης φαινόταν να αποτελεί ένα αξεπέραστο εμπόδιο. Ως αποτέλεσμα, πολλά οπτικοακουστικά υλικά κυκλοφορούσαν χωρίς ήχο.
Σύμφωνα με δημοσίευση στο blog του DeepMind, φαίνεται ότι βρέθηκε λύση και σε αυτό το πρόβλημα: “Εκπαιδεύοντας το σύστημα μας σε βίντεο και ήχο, η τεχνολογία μας μαθαίνει να συνδέει συγκεκριμένα ηχητικά συμβάντα με διάφορες οπτικές σκηνές…”
Στα αρχικά στάδια
Παρόλο που η νέα αυτή εξέλιξη παρουσιάζεται με ενθουσιασμό, τα αποτελέσματα δεν αγγίζουν ακόμα υψηλά επίπεδα. Οι ήχοι που δημιουργούνται θεωρούνται λίγο περιέργοι και όχι ιδιαίτερα ποιοτικοί για να χρησιμοποιηθούν σε επαγγελματικό υλικό.
Ωστόσο, η τεχνολογία αυτή διαθέτει αναμφισβήτητα προοπτικές και μεγάλες δυνατότητες. Άλλωστε, τα γλωσσικά μοντέλα των chatbots, όπως το ChatGPT, δεν ήταν τέλεια στα αρχικά τους στάδια, αλλά με την κατάλληλη βελτιστοποίηση, κατάφεραν να βελτιωθούν σημαντικά.
Μένει λοιπόν να δούμε αν στο μέλλον θα κυκλοφορήσουν ταινίες εξ ολοκλήρου φτιαγμένες από Τεχνητή Νοημοσύνη, συμπεριλαμβανομένων ήχων, μουσικής και φωνών ηθοποιών. Αν και έχουν ήδη κυκλοφορήσει μικρού μήκους ταινίες με Τεχνητή Νοημοσύνη, η δημιουργία μίας ταινίας διάρκειας δύο ωρών φαντάζει ακόμα μακρινό όνειρο.
Επιπλέον, το DeepMind δηλώνει οτι δεν θα διαθέσει προς το παρόν την τεχνολογία αυτή στο ευρύ κοινό για να «αποτρέψει την κατάχρηση», αλλά ίσως και για να μην προκαλέσει αντιδράσεις στους δημιουργούς ταινίως αφού έτσι ενδεχομένως θα κόψει το μεροκάματο πολλών ανθρώπων στη συγκεκριμένη βιομηχανία.
Εκπαίδευση στο YouTube;
Ένα καυτό ερώτημα που προφανώς απασχολεί πολλούς δημιουργούς περιεχομένου είναι πάνω σε ποιο υλικό εκπαιδεύονται τα μοντέλα Τεχνητής Νοημοσύνης που παράγουν βίντεο;
Στο παρελθόν, είχε διατυπωθεί η υπόθεση ότι η OpenAI χρησιμοποίησε βίντεο από το YouTube για την ανάπτυξη του λογισμικού επεξεργασίας βίντεο Sora. Η Google, ωστόσο, δεν μπορούσε να ασκήσει κριτική, καθώς πιθανότατα χρησιμοποίησε και η ίδια παρόμοιες μεθόδους.
Προς το παρόν, παραμένει άγνωστο εάν οι δημιουργοί βίντεο γνωρίζουν (ή γνώριζαν) αυτές τις πρακτικές, εάν αυτές οι υποθέσεις ευσταθούν, και εάν υπάρχει νομική βάση, ώστε να διεκδικήσουν το δίκιο τους
Επιπλέον, όσον αφορά την δημιουργία soundtracks, δεν γίνεται καμία αναφορά στην προέλευση των δεδομένων εκπαίδευσης.