Chez Google I/O, tout est IA en permanence ! Aujourd’hui, Google a annoncé ses nouveaux moteurs de création multimédia IA : Veo, qui peut produire des vidéos 1080p de « haute qualité » ; et Imagen 3, son dernier framework de conversion texte-image. Ni l’un ni l’autre ne semblent particulièrement révolutionnaires, mais ils constituent un moyen pour Google de poursuivre la lutte contre le modèle vidéo Sora d’OpenAI et Dall-E 3, un outil qui est pratiquement devenu synonyme d’images générées par l’IA.
Google affirme que Veo possède « une compréhension avancée du langage naturel et de la sémantique visuelle » pour créer la vidéo que vous avez en tête. Les vidéos générées par l’IA peuvent durer « plus d’une minute ». Veo est également capable de comprendre les techniques cinématographiques et visuelles, comme la notion de timelapse. Mais en réalité, cela devrait être un enjeu de table pour un modèle de génération de vidéo IA, n’est-ce pas ?
Pour prouver que Veo n’a pas pour objectif de voler les emplois des artistes, Google s’est également associé à Donald Glover et Gilga, son studio de création, pour montrer les capacités du modèle. Dans une très brève vidéo promotionnelle, nous voyons Glover et son équipage utiliser du texte pour créer une vidéo d’un cabriolet arrivant dans une maison européenne et d’un voilier glissant sur l’océan. Selon Google, Veo peut mieux simuler la physique du monde réel que ses modèles précédents, et il a également amélioré la façon dont il restitue les images haute définition.
« Tout le monde va devenir réalisateur, et tout le monde devrait être réalisateur », déclare Glover dans la vidéo, gagnant absolument son salaire chez Google. « Au cœur de tout cela, il y a simplement la narration. Plus nous serons capables de nous raconter nos histoires, plus nous nous comprendrons. »
Il reste à voir si quelqu’un voudra réellement regarder des vidéos générées par l’IA, en dehors de la curiosité morbide de voir une machine tenter de recréer algorithmiquement le travail d’artistes humains. Mais cela n’empêche pas Google ou OpenAI de promouvoir ces outils et d’espérer qu’ils seront utiles (ou du moins qu’ils rapporteront beaucoup d’argent). Veo sera disponible aujourd’hui dans l’outil VideoFX de Google pour certains créateurs, et la société affirme qu’il sera également disponible sur YouTube Shorts et d’autres produits. Si Veo finit par devenir une partie intégrée de YouTube Shorts, c’est au moins une fonctionnalité que Google peut dominer sur TikTok.
Quant à Imagen 3, Google fait les promesses habituelles : il s’agit du modèle texte-image de « la plus haute qualité » de l’entreprise, avec un « niveau de détail incroyable » pour des « images photoréalistes et réalistes » et moins d’artefacts. Le véritable test, bien sûr, sera de voir comment il gère les invites par rapport au Dall-E 3. Imagen 3 gère mieux le texte qu’auparavant, dit Google, et il est également plus intelligent dans la gestion des détails des invites longues.
Google travaille également avec des artistes comme Wyclef Jean et Bjorn pour tester son Music AI Sandbox, un ensemble d’outils qui peuvent aider à la création de chansons et de rythmes. Nous n’en avons vu qu’un bref aperçu, mais cela a donné lieu à quelques démos intrigantes :
Le soleil se lève et se couche. Nous mourons tous lentement. Et l’IA devient de jour en jour plus intelligente. Cela semble être le principal point à retenir des derniers outils de création multimédia de Google. Bien sûr, ils s’améliorent ! Google investit des milliards pour faire du rêve de l’IA une réalité, le tout dans le but de réaliser le prochain grand pas en avant dans l’informatique. Est-ce que tout cela améliorera réellement nos vies ? Seront-ils un jour capables de générer un art avec une âme authentique ? Revenez sur Google I/O chaque année jusqu’à ce que l’AGI apparaisse réellement ou que notre civilisation s’effondre.
Restez informé de toutes les actualités de Google I/O 2024 directement ici!