D-ID, la société derrière Deep Nostalgia, vous permet de créer des vidéos générées par l’IA à partir d’une seule image

La société israélienne d’IA D-ID, qui a fourni la technologie pour des projets comme Deep Nostalgia, lance une nouvelle plate-forme où les utilisateurs peuvent télécharger une seule image et un texte pour générer une vidéo. Avec ce nouveau site appelé Creative Reality Studio, la société cible des secteurs tels que la formation et l’éducation en entreprise, la communication interne et externe des entreprises, le marketing produit et la vente.

La plate-forme est assez simple à utiliser : les utilisateurs peuvent télécharger une image d’un présentateur ou en sélectionner un parmi les présentateurs pré-créés pour démarrer le processus de création vidéo. Les utilisateurs payants peuvent accéder à des présentateurs premium qui sont plus « expressifs » car ils ont de meilleures expressions faciales et mouvements de la main que ceux par défaut. Après cela, les utilisateurs peuvent soit taper le texte d’un script, soit simplement télécharger un clip audio du discours de quelqu’un. Les utilisateurs peuvent ensuite sélectionner une langue (la plate-forme prend en charge 119 langues), une voix et des styles tels que joyeux, triste, excité et amical.

Les algorithmes basés sur l’IA de la société généreront une vidéo basée sur ces paramètres. Les utilisateurs peuvent ensuite distribuer la vidéo n’importe où. La société affirme que l’algorithme ne prend que la moitié de la durée de la vidéo pour générer un clip, mais lors de nos tests, il a fallu quelques minutes pour générer une vidéo d’une minute. Cela peut changer en fonction du type de présentateur et de la langue que vous avez sélectionnés.

« La pandémie de COVID-19 a accéléré les besoins en contenu numérique à travers le monde. Un gros problème pour les organisations est la création de contenu éducatif. Lire des documents et passer par des présentations peut être sec et ennuyeux. De plus, ils doivent dépenser des milliers de dollars pour embaucher des acteurs et créer des vidéos éducatives. Nous utilisons donc notre IA pour créer des présentateurs et des tuteurs pour recréer des humains et rendre le contenu plus engageant et efficace », a déclaré Gil Perry, PDG de D-ID, à TechCrunch dans une interview.

Perry a souligné de nombreux cas d’utilisation de cette technologie, allant d’un message multilingue d’un PDG aux employés à des souhaits personnalisés aux utilisateurs d’une organisation.

D-ID a lancé le studio pour des tests à la mi-août afin de corriger les bugs avant le lancement public. Et bien que son objectif principal soit de répondre aux besoins des entreprises de toutes tailles, l’entreprise voit beaucoup d’intérêt des créateurs Sur la plateforme.

La création de vidéos deepfake offensives est un risque. C’est pourquoi la firme israélienne a mis en place des garde-fous comme la filtration des jurons et des propos racistes, ainsi que la reconnaissance d’images pour éviter l’utilisation des visages de personnes célèbres. Il utilise l’API de modération de texte Microsoft Azure pour éliminer les remarques sexuelles et le langage offensant dans les scripts vidéo. D-ID a déclaré que les conditions d’utilisation de la plateforme interdisent aux utilisateurs de créer des vidéos politiques. En cas de violation de l’une de ces règles, l’entreprise peut suspendre le compte du contrevenant et retirer sa vidéo de la bibliothèque.

D-ID a levé 25 millions de dollars dans le cadre de son financement de série B dirigé par Macquarie Capital en mars – avec un total de 47 millions de dollars levés à ce jour. Jusqu’à présent, l’entreprise s’appuyait sur d’autres utilisant son API pour créer du contenu – Deep Nostalgia en est un excellent exemple – avec des clients comme Modelez, Warner Bros. et Josh, une application vidéo courte basée en Inde. Aujourd’hui, l’entreprise étend ses produits lucratifs en lançant un plug-in PowerPoint avec cette plate-forme libre-service. Le plug-in ajoute un présentateur interactif à la plate-forme, de sorte que les utilisateurs n’ont pas simplement à lire les diapositives. Ils peuvent choisir entre différents avatars, voix et langues, tout comme la plateforme libre-service. Mais il n’y a aucune disposition pour avoir un présentateur personnalisé pour le moment.

Au lancement, les utilisateurs pourront s’inscrire gratuitement pour un compte d’essai de 14 jours et créer jusqu’à cinq minutes de vidéo 720p générée par l’IA. Après cela, ils peuvent payer 49 $ par mois pour avoir accès à 15 minutes de vidéo Full HD générée par l’IA, un plugin PowerPoint et une assistance par e-mail.

Les co-fondateurs de D-ID Eliran Kuta, Gil Perry et Sella Blondheim

Les utilisateurs peuvent également télécharger leurs propres clips audio pour le clonage vocal. De plus, la société travaille sur un outil permettant aux utilisateurs de télécharger leurs propres séquences pour entraîner l’IA à être plus expressive afin qu’elle puisse mieux imiter la personne dans la vidéo. Toutes ces fonctionnalités seront limitées au niveau entreprise de l’entreprise.

Alors que la société fait face à la concurrence de Rephrase.ai et de Soul Machines dans le domaine de la vidéo générée par l’IA, elle affirme qu’il n’y a pratiquement aucune entreprise qui prétend générer des vidéos de haute qualité à partir d’une seule image.

Perry a déclaré que D-ID ne vise pas à se limiter aux vidéos de formation, de communication et de marketing en entreprise. Il a également pour ambition de faciliter la traduction des appels vidéo en temps réel et les présentateurs de clones, ce qui fait apparaître un avatar sur la vidéo à votre place pendant que vous dictez l’audio.

La société envisage également de devenir un acteur clé du développement web3/métavers. « Étant donné que nous avons une expertise dans la génération de vidéos à partir d’une seule image. Nous réfléchissons à des moyens de créer des avatars numériques pour le métaverse », a déclaré Perry.

Source-146