Avec la popularité croissante des grands modèles linguistiques (LLM) et des outils d’IA générative comme ChatGPT, les développeurs ont trouvé des cas d’utilisation pour modeler le texte de différentes manières pour des cas d’utilisation allant de la rédaction d’e-mails au résumé d’articles. Désormais, ils cherchent à vous aider à générer des morceaux de musique en tapant simplement quelques mots.
Brett Bauman, le développeur de PlayListAI (anciennement LinupSupply), a lancé cette semaine une nouvelle application appelée Songburst sur l’App Store. L’application n’a pas une courbe d’apprentissage abrupte. Il vous suffit de saisir une invite telle que « Musique de piano apaisante à écouter pendant vos études » ou « Beats funky pour une intro de podcast » pour permettre à l’application de générer un clip musical.
Si vous ne parvenez pas à penser à une invite, l’application propose des invites dans différentes catégories, notamment vidéo, lo-fi, podcast, jeux, méditation et échantillon.
Bauman a déclaré à TechCrunch qu’il avait construit le back-end de l’application en utilisant Vercel et que la musique était générée via Leap. Actuellement, il existe une limitation à la génération de 30 secondes et certaines sorties peuvent ne pas être de grande qualité. Bauman a déclaré qu’au fil du temps, il chercherait à augmenter la durée du clip musical généré et à améliorer la qualité.
Songburst est gratuit à essayer mais il propose un abonnement à 9,99 $ par mois ou 79,99 $ par an. L’abonnement vous donne 20 crédits de chansons par mois et la possibilité de télécharger des morceaux au format mp3. Les utilisateurs peuvent également acheter des crédits supplémentaires par paquets de cinq (7,99 $), 10 (11,99 $) ou 20 (15,99 $).
Bauman a déclaré avoir créé l’application car il existe peu de solutions de synthèse texte-musique natives simples et mobiles autour desquelles des tactiques de spam ne sont pas utilisées pour retirer de l’argent des abonnements.
Cependant, il n’est pas le seul à essayer de créer une application de synthèse texte-musique soignée. Akhil Tolani, qui a créé des applications telles que l’application de collaboration musicale Rapchat, a lancé CassetteAI, disponible sur le Web et sur l’App Store.
Au niveau de l’entrée, CassetteAI fonctionne de la même manière que les autres applications. Vous tapez une invite de musique et cela produit une piste. Cependant, il peut générer un échantillon d’une durée maximale de trois minutes. Le créateur de l’application a déclaré que cela était dû au fait que l’application fonctionne sur un modèle personnalisé basé sur l’architecture hiérarchique seq2seq et qu’elle est formée sur un ensemble de données spécialisé pour générer de la musique libre de droits.
L’outil fournit également une interface permettant aux utilisateurs de créer différentes versions des pistes générées, de les éditer et de les mélanger pour créer une nouvelle piste. Ces outils sont assez basiques, alors ne vous attendez pas à créer une piste principale multicouche à partir de cela pour l’instant.
Tolani a déclaré que l’outil fonctionnait sur une liste d’attente, mais qu’il l’ouvre désormais à davantage de personnes. Il a déclaré à TechCrunch qu’il s’attend également à un abonnement Cassette AI pro au prix de 4,99 $ par mois, qui donnera aux utilisateurs un accès à une génération illimitée de chansons et à des modèles d’IA de meilleure qualité pour une génération de chansons améliorée.
Le développeur a mentionné que Cassette AI est meilleur que d’autres générateurs de musique tels que Mubert et Beatbot car il génère une musique de meilleure qualité avec un délai d’exécution plus rapide. Il a ajouté qu’avec Cassette AI, il souhaite respecter les limites éthiques de l’industrie musicale.
« Nous voulons que les gens voient l’IA comme un outil de création musicale, et non comme un substitut aux créateurs : les calculatrices n’ont pas remplacé les mathématiciens, elles ont simplement facilité le calcul. Nous voulons rendre la production musicale accessible à tous, quel que soit le cas d’utilisation », a-t-il déclaré.
Ces outils ciblent principalement les créateurs, qui peuvent utiliser de la musique libre de droits dans leurs vidéos ou podcasts. Les développeurs espèrent également que les musiciens remarqueront leurs outils et les intégreront dans leur processus de création d’échantillons ou de chansons.
Outre les développeurs indépendants, les grandes entreprises technologiques s’attaquent également au problème de la génération de texte en musique. Google a rendu public son outil MusicLM lors de la conférence des développeurs Google I/O en mai. En juin, Meta a ouvert son propre générateur de musique alimenté par l’IA appelé MusicGen.
Bien que les modèles s’améliorent en ce qui concerne la qualité des pistes générées, des inquiétudes subsistent concernant les données d’entraînement qu’ils utilisent pour créer de la musique. Pour éviter des problèmes juridiques, OpenAI a rendu son modèle Jukebox partiellement open source et a interdit aux utilisateurs de créer de la musique à des fins commerciales. Ensuite, il y a des musiciens avancés en matière d’IA, comme Grimes, qui a invité en avril ses fans à créer des chansons avec sa voix et à partager les redevances avec elle.