ElevenLabs construit une machine de doublage IA universelle

Après que Disney ait sorti un nouveau film en anglais, la société reviendra et le localisera dans 46 langues à travers le monde pour rendre le film accessible à un public aussi large que possible. Il s’agit d’une entreprise colossale, pour laquelle Disney dispose d’une division entière – Disney Character Voices International Inc – pour gérer la tâche. Et ce n’est pas comme si tu faisais revenir Chris Pratt dans la cabine d’enregistrement pour doubler son GotG III lignes en islandais et en swahili – chaque version sonne un peu différemment étant donné les doubleurs locaux. Mais avec un nouveau système de « doublage IA » d’ElevenLabs, nous pourrions bientôt obtenir une recréation fidèle de la voix de Pratt, quelle que soit la langue parlée à l’écran.

ElevenLabs est une startup d’IA qui propose un service de clonage vocal, permettant aux abonnés de générer des vocalisations presque identiques avec l’IA sur la base de quelques minutes de téléchargement d’échantillons audio. Il n’est pas tout à fait surprenant que dès la sortie de la fonctionnalité en version bêta, elle ait été immédiatement exploitée pour usurper l’identité de célébrités, parfois même à leur insu et sans leur consentement préalable.

La nouvelle fonctionnalité de doublage AI fait essentiellement la même chose – dans plus de 20 langues différentes, dont l’hindi, le portugais, l’espagnol, le japonais, l’ukrainien, le polonais et l’arabe – mais légitimement et avec autorisation. Cet outil est conçu pour être utilisé par les sociétés de médias, les éducateurs et les influenceurs Internet qui ne disposent pas de Disney Money™ pour financer leurs efforts d’adaptation mondiaux.

ElevenLabs affirme que le système sera capable non seulement de traduire « le contenu parlé dans une autre langue en quelques minutes », mais également de générer de nouveaux dialogues parlés dans la langue cible en utilisant la propre voix de l’acteur. Ou, du moins, une récréation générée par l’IA. Le système serait même capable de conserver « l’émotion et l’intonation » du dialogue existant et de les transférer dans la traduction générée.

« Cela aidera le public à profiter du contenu qu’il souhaite, quelle que soit la langue qu’il parle », a déclaré Mati Staniszewski, PDG d’ElevenLabs, dans un communiqué de presse. « Et cela signifiera que les créateurs de contenu pourront facilement et authentiquement accéder à un public bien plus large à travers le monde. »

Source-145