Την προηγούμενη εβδομάδα, ερευνητές της Google παρουσίασαν ένα νέο σύστημα τεχνητής νοημοσύνης που ονομάζεται MusicLM, που μετατρέπει το κείμενο σε μουσική και συνθέτει τραγούδια που μπορούν να διαρκέσουν έως και πέντε λεπτά.
Η χρήση της τεχνητής νοημοσύνης για την σύνθεση μουσικής δεν είναι κάτι καινούργιο. Ωστόσο, το MusicLM είναι το πρώτο εργαλείο που μπορεί πραγματικά να δημιουργήσει μουσική από απλό κείμενο.
Σε ακαδημαϊκή εργασία που παρουσίασε η ερευνητική ομάδα περιγράφει το MusicLM ως «ένα μοντέλο που παράγει μουσική υψηλής πιστότητας από περιγραφές κειμένου» και υποστήριξε ότι «ξεπερνά τα προηγούμενα συστήματα τόσο στην ποιότητα του ήχου όσο και στην τήρηση της περιγραφής του κειμένου», όπως αναφέρει το Euronews.
Το MusicLM χρησιμοποιεί ένα μοντέλο τεχνητής νοημοσύνης που έχει εκπαιδευτεί σε ένα μεγάλο σύνολο δεδομένων μη επισημασμένης μουσικής, μαζί με λεζάντες από το MusicCaps, ένα νέο σύνολο δεδομένων που αποτελείται από 5.521 ζεύγη μουσικής-κειμένου.
Οι χρήστες θα πρεπει να προσδιορίσουν όσο το δυνατόν περισσότερες λεπτομέρειες σχετικά με το είδος μουσικής, τα όργανα, ή το στυλ που θέλουν, ώστε το σύστημα τεχνητής νοημοσύνης της Google να δημιουργήσει τον καλύτερο δυνατό ήχο.
Οι ερευνητές της Google σχεδιάζουν ήδη τις μελλοντικές βελτιώσεις του συστήματος.
«Η μελλοντική εργασία μπορεί να επικεντρωθεί στην παραγωγή στίχων, μαζί με τη βελτίωση της επεξεργασίας κειμένου και της ποιότητας της φωνής. Μια άλλη πτυχή είναι η μοντελοποίηση της δομής τραγουδιών υψηλού επιπέδου, όπως η εισαγωγή, ο στίχος και το ρεφρέν», έγραψαν στην εργασία τους οι ερευνητές.
Προς το παρόν, η Google δεν σκοπεύει να κυκλοφορήσει το MusicLM καθώς τίθεται θέμα με τα πνευματικά δικαιώματα διάφορων μουσικών, ενώ υπάρχει κίνδυνος κατάχρησης δημιουργικού περιεχομένου. Αξίζει να σημειωθεί ότι κατά τη διάρκεια ενός πειράματος, οι ερευνητές της Google διαπίστωσαν ότι περίπου το 1% της μουσικής που παρήγαγε το MusicLM αντιγράφηκε απευθείας από τα τραγούδια με τα οποία είχε εκπαιδευτεί.
ΠΗΓΗ: Ars Technica, Euronews