Vos conversations avec ChatGPT sont sur le point de devenir beaucoup plus personnelles.
OpenAI, le créateur de ChatGPT, annoncé hier (lundi), il lancera de nouvelles fonctionnalités de voix et d’image pour le chatbot IA au cours des deux prochaines semaines.
Ceux qui paient pour un abonnement ChatGPT Plus, ainsi que les utilisateurs Enterprise, pourront bientôt avoir des conversations aller-retour avec ChatGPT. Ceux qui utilisent la version gratuite seront toujours limités à la saisie de texte. Les fonctionnalités vocales incluront un ensemble de voix humaines générées par de véritables acteurs vocaux. Un nouveau texte pour parler Ce modèle associé au système de reconnaissance vocale open source Whisper alimentera ces conversations réalistes.
OpenAI a certainement fait de son mieux en publiant de courts échantillons de ce à quoi ressemblent les nouvelles voix de ChatGPT en lisant un poème ou un discours. Ils constituent une avancée audible par rapport aux voix génériques de l’IA que certains sites Web proposent pour exprimer (robotiquement) leurs articles à lecture longue.
Avoir des problèmes trouver les bons mots lorsque vous parlez à ChatGPT ? La deuxième grande mise à jour à venir est la fonctionnalité de chat par image. Si vous oubliez momentanément les embouts en plastique ou en métal des meilleures chaussures de course, les lacets sont appelés aglets mais vous instamment devez demander à ChatGPT s’ils peuvent être remplacés, prenez simplement une photo et envoyez-la au chat. Vous pouvez discuter de plusieurs images ou utiliser l’outil de dessin pour guider l’IA sur la partie spécifique d’une image à laquelle vous faites référence.
Le traitement des images sera alimenté par les modèles GPT-3.5 et GPT-4 qui peuvent appliquer leurs compétences de raisonnement linguistique à différents types d’images tels que des photographies, des captures d’écran et des documents contenant à la fois du texte et des images, selon OpenAI.
Volontairement abrutissant
Dans son annonce concernant ces nouvelles fonctionnalités, OpenAI a reconnu qu’elles créaient la possibilité pour des personnes de tenter de se faire passer pour des personnalités publiques ou de commettre une fraude.
« C’est pourquoi nous utilisons cette technologie pour alimenter un cas d’utilisation spécifique : le chat vocal. Le chat vocal a été créé avec des acteurs vocaux avec lesquels nous avons directement travaillé », a déclaré OpenAI.
En ce qui concerne le traitement des images, la capacité de ChatGPT à analyser et à faire des déclarations sur les personnes figurant sur les photos a été délibérément limitée « car ChatGPT n’est pas toujours précis et ces systèmes doivent respecter la vie privée des individus », a déclaré la société.
Les fonctionnalités vocales et image seront déployées auprès des utilisateurs de ChatGPT Plus et Enterprise au cours des deux prochaines semaines. La voix sera disponible pour iOS et Android les utilisateurs à condition qu’ils s’inscrivent. Les fonctionnalités d’image peuvent être utilisées sur toutes les plateformes.