dimanche, décembre 22, 2024

OpenAI affirme que son modèle gratuit GPT-4o peut parler, rire, chanter et voir comme un humain

OpenAI a annoncé lundi GPT-4o, un tout nouveau modèle d’IA qui, selon la société, est un pas de plus vers « une interaction homme-machine beaucoup plus naturelle ». Le nouveau modèle accepte toute combinaison de texte, d’audio et d’images en entrée et peut générer une sortie dans les trois formats. Il est également capable de reconnaître les émotions, vous permet de les interrompre au milieu d’un discours et de répondre presque aussi vite qu’un être humain lors d’une conversation.

« La particularité de GPT-4o est qu’il offre une intelligence de niveau GPT-4 à tout le monde, y compris nos utilisateurs gratuits », a déclaré Mira Murati, CTO d’OpenAI, lors d’une présentation diffusée en direct. « C’est la première fois que nous faisons un grand pas en avant en matière de facilité d’utilisation. »

Au cours de la présentation, OpenAI a présenté GPT-4o traduisant en direct entre l’anglais et l’italien, aidant un chercheur à résoudre une équation linéaire en temps réel sur papier et fournissant des conseils sur la respiration profonde à un autre cadre d’OpenAI simplement en écoutant ses respirations.

Le « o » de GPT-4o signifie « omni », une référence aux capacités multimodales du modèle. OpenAI a déclaré que GPT-4o a été formé sur le texte, la vision et l’audio, ce qui signifie que toutes les entrées et sorties sont traitées par le même réseau neuronal. Ceci est différent des modèles précédents de la société, GPT-3.5 et GPT-4, qui permettaient aux utilisateurs de poser des questions simplement en parlant, mais de transcrire ensuite le discours en texte. Cela supprimait le ton et l’émotion et rendait les interactions plus lentes.

OpenAI rendra le nouveau modèle accessible à tous, y compris aux utilisateurs gratuits de ChatGPT, au cours des prochaines semaines et publiera également une version de bureau de ChatGPT, initialement pour Mac, à laquelle les utilisateurs payants auront accès à partir d’aujourd’hui.

L’annonce d’OpenAI intervient un jour avant Google I/O, la conférence annuelle des développeurs de l’entreprise. Peu de temps après qu’OpenAI ait révélé GPT-4o, Google a lancé une version de Gemini, son propre chatbot IA, avec des capacités similaires.

Source-145

- Advertisement -

Latest