L’intelligence artificielle s’est récemment infiltrée dans le monde de Grand Theft Auto V de Rockstar grâce à un nouveau mod.
Le mod s’appelle Sentient Streets et permet aux joueurs d’interagir avec plus de 30 PNJ alimentés par l’IA tout au long de la mission. Chaque personnage a une voix unique provenant du site Web de synthèse vocale et de clonage de voix d’IA ElevenLabs. Le mod est conçu pour que les joueurs aient des conversations ouvertes et vocales avec des membres de la secte, des policiers et des civils.
Sentient Streets a été construit par le moddeur vétéran Bloc à l’aide du moteur de caractères Inworld, qui comprend des fonctionnalités telles que l’attribution d’objectifs, d’actions, de relations et de voix aux PNJ alimentés par l’IA.
Sur Youtube, Bloc a démontré comment les conversations avec les PNJ fonctionnent dans Sentient Streets. Vous vous approchez d’un personnage, appuyez sur une touche pour attirer son attention, puis vous pouvez commencer à lui parler via votre microphone. Bloc a demandé à un policier son nom et comment il avait obtenu son surnom, et après une courte pause, le PNJ a répondu avec une petite anecdote. Ce n’est pas tout à fait naturel – le PNJ a répété certaines informations dans des réponses consécutives – mais chaque personnage est programmé avec des personnalités et des histoires différentes.
Les PNJ ont répondu à toutes les questions posées par Bloc via le microphone, mais vous pouvez certainement dire que les réponses sont générées par l’IA. Par exemple, voici une réplique d’une nouvelle recrue de la police à qui Bloc s’est adressé dans la vidéo de jeu : « Eh bien, eh bien, on dirait que quelqu’un a l’œil pour les nouveaux visages. Coupable, officier débutant se présentant au travail ! Prêt à apporter un peu d’éclat à cette ville? »
Avec l’intelligence d’Inworld #IA PNJ et @elevenlabsio technologie vocale, expérience #GTAV comme jamais auparavant dans le mod Sentient Streets de Bloctheworker.
En savoir plus sur l’intégration ElevenLabs x Inworld : https://t.co/WuNz53ZRbq#gamesdev #gamemod #chatgpt #aicharacters pic.twitter.com/HD94rw2Iql
– Inworld IA (@inworld_ai) 8 août 2023
Bloc a continué à démontrer les conversations de l’IA au fur et à mesure que la démo progressait, y compris de longs allers-retours avec son partenaire lorsqu’ils roulaient autour de Los Santos dans leur voiture de police. Dans une interview avec IGN, Bloc a déclaré que les joueurs peuvent pousser les conversations avec les PNJ assez loin.
« Surtout avec le système d’IA actuel d’Inworld en place, les personnages peuvent vraiment agir en fonction de leurs antécédents », a déclaré Bloc. « Par exemple, si c’est une personne folle, vous pouvez entendre cette folie dans son discours. Ou si une personne est un personnage juste, vous obtenez également cette ambiance de son discours. Toutes ces variations entraînent des conversations hilarantes et parfois effrayantes. »
En plus des conversations générées par l’IA, toute l’histoire de Sentient Streets tourne également autour de l’intelligence artificielle. Un culte mortel appelé les NihiAIists vise à prendre le contrôle de Los Santos de GTA V. Le groupe vénère une IA invisible comme leur dieu, et les joueurs prennent le contrôle d’un officier du département de police de Los Santos qui s’efforce d’arrêter le plan de la secte.
Questions éthiques entourant l’utilisation des voix de l’IA dans les mods
Certaines questions éthiques se posent lorsque l’on creuse dans les origines de ces voix générées par l’IA. Bloc a utilisé la bibliothèque de voix standard disponible sur ElevenLabs, et ElevenLabs a fait la lumière sur l’origine de ses voix dans une déclaration à IGN.
« Les voix standard disponibles par défaut sur la plate-forme sont soit générées par des algorithmes d’IA qui échantillonnent les caractéristiques vocales au hasard (c’est-à-dire qu’elles n’imitent ni ne reproduisent la voix d’un individu spécifique) ou sont développées par le biais de partenariats légalement contractés et limités dans le temps avec des acteurs vocaux, avec de nouvelles voix d’IA personnalisées créées en conséquence », lit-on dans la déclaration d’ElevenLabs. « ElevenLabs n’offre aucune voix d’IA sur la plate-forme basée sur la voix d’une personne réelle sans l’autorisation explicite de cette personne. »
Récemment, ElevenLabs a été utilisé pour générer des voix d’IA utilisées dans NSFW Skyrim Mods hébergé sur Nexus Mods. La montée récente de l’IA a été une préoccupation pour les écrivains et les acteurs, ce qui a amené un acteur à dire à IGN L’IA est « l’ennemi invisible que nous combattons en ce moment ».
Les utilisateurs peuvent soumettre des clips vocaux de personnes réelles pour les convertir en une voix clonée générée par l’IA, mais ElevenLabs indique clairement que la soumission de voix réelles pour lesquelles les utilisateurs n’ont pas les droits n’est pas autorisée sur la plate-forme. Mais c’est une chose très difficile à suivre, étant donné le nombre de mods qui utilisent des voix générées par l’IA de vrais acteurs de la voix.
« ElevenLabs permet également aux utilisateurs de créer de nouvelles voix d’IA générées de manière aléatoire et de les partager dans le cadre de la bibliothèque de voix dirigée par la communauté », a déclaré ElevenLabs. « Séparément, les utilisateurs ont la possibilité de créer des voix clonées pour leur propre travail, s’ils disposent des droits et des autorisations sur ces voix. Ces voix ne peuvent pas être partagées avec la bibliothèque vocale. Les utilisateurs qui enfreignent les conditions d’utilisation sont bannis de – tout le monde est encouragé à signaler le contenu qui, selon lui, a enfreint ces conditions. »
Sur Site officiel d’ElevenLabsles conditions d’utilisation stipulent que « le contenu qui n’est pas protégé par la loi peut être réutilisé librement, y compris pour le clonage de la voix. Ce type de contenu est également connu sous le nom de contenu « du domaine public » ou « du domaine public ». »
ElevenLabs énumère quelques exemples de ce qui est qualifié de contenu du domaine public, y compris les matériaux qui n’étaient pas protégés par la loi en premier lieu, les matériaux dont la protection a expiré ou les matériaux dédiés au domaine public par leurs créateurs. Ailleurs, ElevenLabs cite « une grande quantité de livres audio et, dans une moindre mesure, de podcasts » comme source où l’IA a été formée.
L’utilisation des voix de l’IA dans les mods mettra certainement beaucoup de joueurs mal à l’aise quant à l’avenir de l’IA, mais le créateur du mod Bloc ne le voit pas de cette façon.
« Je pense que le contenu généré par l’IA ne remplacera jamais le contenu créé par l’homme, et il ne devrait pas le faire de toute façon. L’IA est un outil, un outil très puissant et utile, mais toujours un outil. Au lieu de remplacer, l’IA transformera le contenu créé par l’homme. et peut-être l’améliorer. »
Sentient Streets est disponible en téléchargement sur Nexus Mods.
Logan Plant est un rédacteur indépendant pour IGN qui couvre l’actualité des jeux vidéo et du divertissement. Il a plus de sept ans d’expérience dans l’industrie du jeu avec des signatures chez IGN, Nintendo Wire, Switch Player Magazine et Lifewire. Retrouvez-le sur Twitter @LoganJPlant.