Le nouveau modèle o1 d’OpenAI est volontairement plus lent

OpenAI a dévoilé son dernier modèle d’intelligence artificielle baptisé o1, qui, selon l’entreprise, peut effectuer des tâches de raisonnement complexes plus efficacement que ses prédécesseurs. Cette sortie intervient alors qu’OpenAI fait face à une concurrence croissante dans la course au développement de systèmes d’IA plus sophistiqués.

O1 a été formé pour « passer plus de temps à réfléchir aux problèmes avant de répondre, comme le ferait une personne », a déclaré OpenAI sur son site Web. « Grâce à la formation, [the models] « Les élèves apprennent à affiner leur processus de réflexion, à essayer différentes stratégies et à reconnaître leurs erreurs. » OpenAI envisage que le nouveau modèle soit utilisé par les chercheurs en santé pour annoter les données de séquençage cellulaire, par les physiciens pour générer des formules mathématiques et par les développeurs de logiciels.

Les systèmes d’IA actuels sont essentiellement des versions plus sophistiquées de la saisie semi-automatique, générant des réponses via des statistiques au lieu de « réfléchir » réellement à une question, ce qui signifie qu’ils sont moins « intelligents » qu’ils ne le paraissent. Lorsque Engadget a essayé de faire en sorte que ChatGPT et d’autres chatbots IA résolvent le problème, Le New York Times Au Spelling Bee, par exemple, ils ont tâtonné et ont produit des résultats insensés.

Avec o1, l’entreprise affirme qu’elle « remet le compteur à 1 » avec un nouveau type de modèle d’IA conçu pour réellement s’engager dans la résolution de problèmes complexes et la pensée logique. Dans un article de blog détaillant le nouveau modèle, OpenAI a déclaré qu’il obtenait des résultats similaires à ceux des étudiants en doctorat sur des tâches de référence difficiles en physique, chimie et biologie, et qu’il excellait en mathématiques et en codage. Par exemple, son modèle phare actuel, GPT-4o, n’a résolu correctement que 13 % des problèmes lors d’un examen de qualification pour l’Olympiade internationale de mathématiques, contre 83 % pour o1.

Le nouveau modèle n’inclut cependant pas de fonctionnalités telles que la navigation sur le Web ou la possibilité de télécharger des fichiers et des images. Et, selon Le Vergeil est nettement plus lent à traiter les invites que GPT-4o. Bien qu’il ait plus de temps pour examiner ses résultats, o1 n’a pas résolu le problème des « hallucinations » — un terme désignant les modèles d’IA qui composent l’information. « Nous ne pouvons pas dire que nous avons résolu les hallucinations », a déclaré Bob McGrew, directeur de la recherche de l’entreprise. Le Verge.

O1 est encore à ses débuts. OpenAI l’appelle une « preview » et la met à disposition uniquement des clients payants de ChatGPT à partir d’aujourd’hui, avec des restrictions sur le nombre de questions qu’ils peuvent lui poser par semaine. De plus, OpenAI lance également o1-mini, une version allégée qui, selon la société, est particulièrement efficace pour le codage.

Source-145