Meta a dévoilé son IA de génération de texte en image Make-a-Scene en juillet, qui, comme Dall-E et Midjourney, utilise des algorithmes d’apprentissage automatique (et des bases de données massives d’œuvres d’art en ligne) pour créer des représentations fantastiques d’invites écrites. Jeudi, le PDG de Meta, Mark Zuckerberg, a révélé le contemporain plus animé de Make-a-Scene, Make-a-Video.
Comme son nom l’indique, Make-a-Video est « un nouveau système d’IA qui permet aux gens de transformer des invites de texte en clips vidéo brefs et de haute qualité », a écrit Zuckerberg dans un blog Meta jeudi. Sur le plan fonctionnel, Video fonctionne de la même manière que Scene – en s’appuyant sur un mélange de traitement du langage naturel et de réseaux de neurones génératifs pour convertir des invites non visuelles en images – il s’agit simplement d’extraire du contenu dans un format différent.
« Notre intuition est simple : découvrez à quoi ressemble le monde et comment il est décrit à partir de données texte-image appariées, et apprenez comment le monde évolue à partir de séquences vidéo non supervisées », a écrit une équipe de chercheurs de Meta dans un article de recherche publié jeudi matin. Cela a permis à l’équipe de réduire le temps nécessaire pour former le modèle vidéo et d’éliminer le besoin de données texte-vidéo appariées, tout en préservant « l’immensité (diversité des représentations esthétiques, fantastiques, etc.) des modèles de génération d’images d’aujourd’hui. »
Comme pour la plupart des recherches sur l’IA de Meta, Make-a-Video est publié en tant que projet open source. « Nous voulons réfléchir à la manière dont nous construisons de nouveaux systèmes d’IA générative comme celui-ci », a noté Zuckerberg. « Nous partageons ouvertement cette recherche et ces résultats sur l’IA générative avec la communauté pour obtenir leurs commentaires, et nous continuerons à utiliser notre cadre d’IA responsable pour affiner et faire évoluer notre approche de cette technologie émergente. »
Comme avec apparemment toutes les IA génératives qui sont publiées, l’opportunité d’une mauvaise utilisation de Make-a-Video n’est pas négligeable. Pour devancer toute manigance néfaste potentielle, l’équipe de recherche a nettoyé de manière préventive l’ensemble de données de formation Make-a-Video de toute imagerie NSFW ainsi que des phrases toxiques.
Tous les produits recommandés par Engadget sont sélectionnés par notre équipe éditoriale, indépendante de notre maison mère. Certaines de nos histoires incluent des liens d’affiliation. Si vous achetez quelque chose via l’un de ces liens, nous pouvons gagner une commission d’affiliation. Tous les prix sont corrects au moment de la publication.