Anthropic affirme que son nouveau chatbot Claude 3 AI obtient de meilleurs résultats sur les tests clés que GPT-4

La bataille entre les chatbots IA est bien plus qu’une course à deux. Anthropic, la société formée par plusieurs anciens employés d’OpenAI, affirme que son nouveau modèle de langage Claude 3 surpasse ChatGPT et Gemini de Google dans plusieurs benchmarks clés de l’industrie. Il a même atteint des niveaux « quasi-humains » sur certaines tâches, a écrit l’entreprise dans un blog.

Il y a trois nouveaux chatbots sous l’égide de Claude 3, dont Haiku, Sonnet et Opus. Sonnet alimente le chatbot Claude.ai et est proposé gratuitement avec une connexion par e-mail. Pendant ce temps, Opus est le LLM le plus grand et le plus puissant et sera disponible avec un abonnement de 20 $ par mois via le service « Claude Pro ». Il est également multimodal, il peut donc fonctionner à la fois avec des entrées de texte et d’image, contrairement aux versions précédentes.

Tous les modèles Claude 3 « peuvent alimenter des discussions client en direct, des saisies automatiques et des tâches d’extraction de données où les réponses doivent être immédiates et en temps réel », a déclaré la société. En plus de « résultats quasi instantanés » prometteurs, ils sont censés pouvoir gérer des instructions plus longues et en plusieurs étapes avec une précision accrue.

Anthropic affirme que son nouveau chatbot Claude 3 AI obtient de meilleurs résultats sur les tests clés que GPT-4

Anthropique

Opus a montré un meilleur raisonnement au niveau des études supérieures que GPT-4, avec un score de 14,7 % plus élevé à ce test que GPT-4. Il a également battu le chatbot d’OpenAI dans des tâches impliquant les mathématiques, le codage, le raisonnement et les connaissances.

Ils surpassent également les anciens modèles Claude. « Pour la grande majorité des charges de travail, Sonnet est 2 fois plus rapide que Claude 2 et Claude 2.1 avec des niveaux d’intelligence plus élevés. Il excelle dans les tâches exigeant des réponses rapides, comme la récupération de connaissances ou l’automatisation des ventes. Opus offre des vitesses similaires à Claude 2 et 2.1, mais avec des niveaux d’intelligence beaucoup plus élevés », selon Anthropic.

Haiku, la plus petite version du Claude 3, est « le modèle le plus rapide et le plus rentable du marché ». À cette fin, il est capable de lire un document de recherche dense comportant des tableaux et des graphiques en moins de trois secondes.

La société a également noté que Claude 3 « peut traiter un large éventail de formats visuels, notamment des photos, des tableaux, des graphiques et des diagrammes techniques », aidant ainsi les entreprises qui utilisent des PDF, des organigrammes ou des diapositives de présentation. Il sera également moins susceptible de refuser des contenus inoffensifs grâce à une compréhension plus nuancée des demandes, tout en reconnaissant le « préjudice réel ».

Anthropic a déclaré que Claude AI est guidé par 10 piliers fondamentaux secrets de l’équité. Claude 3 a été formé sur des données internes non publiques et des données publiques, à l’aide du matériel d’Amazon Web Services (AWS) et de Google Cloud (Amazon a récemment investi 4 milliards de dollars dans Anthropic).

Claude 3 Opus et Claude 3 Sonnet sont désormais disponibles via l’API d’Anthropic, et Haiku devrait bientôt suivre. Sonnet est également accessible via Amazon Bedrock et en avant-première privée sur Vertex AI Model Garden de Google Cloud.

Cet article contient des liens d’affiliation ; si vous cliquez sur un tel lien et effectuez un achat, nous pouvons gagner une commission.

Source-145