Meta ouvre les sources d’un générateur de musique alimenté par l’IA

Meta ouvre les sources d’un générateur de musique alimenté par l’IA

Ne se laissant pas distancer par Google, Meta a publié son propre générateur de musique basé sur l’intelligence artificielle et, contrairement à Google, l’a mis en open source.

Appelé MusicGen, l’outil de génération de musique de Meta, dont une démo est disponible ici, peut transformer une description textuelle (par exemple, « Une chanson pop des années 80 avec une grosse batterie et des nappes de synthé en arrière-plan ») en environ 12 secondes d’audio, à peu de chose près. MusicGen peut éventuellement être « piloté » par un son de référence, comme une chanson existante, auquel cas il essaiera de suivre à la fois la description et la mélodie.

Meta indique que MusicGen a été entraîné sur 20 000 heures de musique, dont 10 000 pistes musicales sous licence de « haute qualité » et 390 000 pistes instrumentales provenant de ShutterStock et de Pond5, une grande bibliothèque de médias de stock. L’entreprise n’a pas fourni le code utilisé pour entraîner le modèle, mais elle a déclaré a a mis à disposition des modèles pré-entraînés que toute personne disposant du matériel adéquat – principalement un GPU avec environ 16 Go de mémoire – peut exécuter.

Quelles sont les performances de MusicGen ? Bien, je dirais – mais certainement pas assez bien pour mettre les musiciens humains au chômage. Ses chansons sont raisonnablement mélodiques, du moins pour des requêtes de base telles que « musique ambiante chiptunes », et – à mes oreilles – au même niveau (si ce n’est un peu mieux) que les résultats du générateur de musique IA de Google, MusicLM. Mais ils ne gagneront pas de prix.

Voici le résultat de MusicGen pour « jazzy elevator music » :

Et voici la réponse de MusicLM :


Ensuite, j’ai donné une invite plus compliquée pour essayer de faire tourner MusicGen en bourrique : « Lo-fi slow BPM electro chill with organic samples ». MusicGen a étonnamment surpassé MusicLM en termes de cohérence musicale, produisant quelque chose qui trouverait facilement sa place sur Lofi Girl.

Voici l’échantillon de MusicGen :

Et voici celui de MusicLM :

Pour changer un peu les choses, j’ai essayé d’utiliser les deux outils pour générer une chanson pour piano dans le style de George Gershwin. Je dis « essayé » parce que, dans un effort pour prévenir les problèmes de droits d’auteur liés aux outils de musique générative, Google a mis en place un filtre dans la version publique de MusicLM qui bloque les invites mentionnant des artistes spécifiques.

MusicGen ne dispose pas d’un tel filtre. Mais les résultats pour « Background piano music in the style of Gershwin » laissent à désirer, je dois le dire :

La musique générative s’améliore, c’est évident (voir Riffusion, Dance Diffusion et OpenAI’s Jukebox). Mais des problèmes éthiques et juridiques majeurs doivent encore être résolus. L’IA comme MusicGen « apprend » à partir de la musique existante pour produire des effets similaires, un fait avec lequel tous les artistes – ou les utilisateurs de l’IA générative – ne sont pas à l’aise.

De plus en plus souvent, des morceaux faits maison qui utilisent l’IA générative pour évoquer des sons familiers pouvant être considérés comme authentiques, ou du moins assez proches, sont devenus viraux. Les labels musicaux se sont empressés de les signaler à leurs partenaires de diffusion en continu, en invoquant des problèmes de propriété intellectuelle – et ils ont généralement eu gain de cause. Mais il n’est toujours pas clair si la musique « deepfake » viole les droits d’auteur des artistes, des labels et des autres détenteurs de droits.

Il ne faudra peut-être pas attendre longtemps avant qu’il y ait des directives en la matière. Plusieurs procès en cours devant les tribunaux auront probablement une incidence sur l’IA génératrice de musique, notamment un procès portant sur les droits des artistes dont les œuvres sont utilisées pour former des systèmes d’IA à leur insu ou sans leur consentement.

Pour sa part, Meta, qui n’impose pas de restrictions à l’utilisation de MusicGen, affirme que toute la musique sur laquelle MusicGen a été entraîné était « couverte par des accords légaux avec les détenteurs de droits », y compris un accord avec Shutterstock.

IA