Mercredi, NBC a annoncé son intention d’utiliser un clone généré par l’IA de la voix du célèbre commentateur sportif Al Michaels pour commenter les résumés vidéo quotidiens en streaming des Jeux olympiques d’été de 2024 à Paris, qui débuteront le 26 juillet. La narration alimentée par l’IA sera diffusée dans « Your Daily Olympic Recap on Peacock », le service de streaming de NBC. Mais cette nouvelle utilisation très médiatisée du clonage vocal inquiète les critiques, qui affirment que la technologie pourrait évincer les commentateurs sportifs en devenir en conservant les anciens personnages pour toujours.
NBC affirme avoir créé une « recréation IA de haute qualité » de la voix de Michaels, formée sur les apparitions passées de Michaels sur NBC pour capturer son style de prestation distinctif.
Le diffuseur chevronné, vénéré dans le monde des commentateurs sportifs pour son emblématique « Croyez-vous aux miracles ? Oui ! » appelé pendant les Jeux olympiques d’hiver de 1980, couvre les sports à la télévision depuis 1971, y compris une série très médiatisée de couverture play-by-play des matchs de football de la NFL pour ABC et NBC depuis les années 1980. Cependant, NBC l’a retiré de la couverture de la NFL en 2023, peut-être en raison de son âge.
Michaels, âgé de 79 ans, a partagé son scepticisme initial quant au projet dans une interview avec Vanity Fair, comme le note NBC News. Après avoir entendu la version IA de sa voix, qui peut saluer les téléspectateurs par leur nom, il a décrit l’expérience comme « étonnante » et « un peu effrayante ». Il a déclaré que la récréation de l’IA était « près de 2% parfaite » en imitant son style.
L’article de Vanity Fair donne un aperçu du fonctionnement du nouveau système d’IA de NBC. Il utilise d’abord un grand modèle de langage (une technologie similaire à celle qui alimente ChatGPT) pour analyser les sous-titres et les métadonnées de la couverture vidéo des Jeux olympiques de NBC, résumant les événements et écrivant une sortie personnalisée pour imiter le style de Michaels. Ce texte est ensuite introduit dans un modèle d’IA vocale non spécifié formé sur les précédentes apparitions de Michaels sur NBC, reproduisant apparemment ses prononciations et intonations uniques.
NBC estime que le système pourrait générer près de 7 millions de versions personnalisées des résumés pendant les matchs aux États-Unis, à partir des 5 000 heures de diffusion en direct de la chaîne. Grâce à ce système, chaque utilisateur de Peacock recevra environ 10 minutes de résumés personnalisés.
Un rôle diminué pour l’humain à l’avenir ?
Ce n’est un secret pour personne : même si l’IA fait l’objet d’un battage médiatique intense en ce moment, elle est également controversée chez certains. En entendant l’annonce de NBC, les critiques de la technologie de l’IA ont vivement réagi. « @NBCSports« C’est dégoûtant », a tweeté l’actrice et cinéaste Justine Bateman, qui utilise fréquemment X pour critiquer les technologies qui pourraient remplacer les écrivains ou les interprètes humains à l’avenir.
Un fil de réponses similaires d’utilisateurs de X réagissant à l’exemple de vidéo fourni ci-dessus comprenait des critiques telles que : « Cela semble assez étrange quand c’est le même ton pour chaque mot. « aucun autre utilisateur n’a écrit : « Cela semble tellement contre nature. Personne ne parle comme ça » . «
Cette technologie ne remplacera pas les commentateurs sportifs humains habituels de NBC lors de la couverture des Jeux olympiques de cette année et, comme d’autres formes d’IA, elle s’appuie largement sur le travail humain existant en analysant et en régurgitant le contenu créé par l’homme sous la forme de sous-titres extraits des images de NBC.
À long terme, grâce aux technologies de clonage des médias par l’IA, comme la synthèse de la voix, de la vidéo et de l’image, les célébrités d’aujourd’hui pourraient être en mesure d’atteindre une forme d’immortalité médiatique qui permettrait à de nouvelles itérations de leur image de persister à travers les générations, ce qui pourrait potentiellement rapporter des droits de licence à celui qui détient les droits.
Nous l’avons déjà vu avec James Earl Jones jouant la voix de Dark Vador, et la tendance se poursuivra probablement avec d’autres voix de célébrités, à condition que l’argent soit suffisant. À terme, cela pourrait s’étendre également à des musiciens célèbres grâce à la synthèse musicale et à des acteurs célèbres dans les applications de synthèse vidéo.
La possibilité d’être évincés par des répliques de l’IA a été largement prise en compte dans la grève des acteurs hollywoodiens l’année dernière, la présidente du syndicat SAG-AFTRA, Fran Drescher, ayant déclaré : « Si nous ne restons pas debout maintenant, nous allons tous avoir des ennuis. Nous allons tous risquer d’être remplacés par des machines. »
Pour les entreprises qui souhaitent monétiser leurs propriétés médiatiques le plus longtemps possible, l’IA peut constituer un moyen de conserver un héritage médiatique grâce à l’automatisation. Mais les futurs artistes humains devront peut-être rivaliser avec tous les plus grands artistes du passé, rendus grâce à l’IA, pour percer et se forger une nouvelle carrière – à condition qu’il y ait de la place pour les artistes humains.
« Al Michaels devenu Al Michaels « Parce qu’il a été amené à remplacer des gens qui sont morts, qui ont pris leur retraite ou qui sont partis », a tweeté un écrivain nommé Geonn Cannon sur X. « S’il ne peut pas faire le emploi plus, il est temps de laisser le prochain Al Michaels essayez-le au lieu de simplement planter une goule générée par code sur une chaise vide.«