Claude, le rival de ChatGPT d’Anthropic, peut désormais analyser 150 000 mots en une seule invite

Anthropic, son rival d’OpenAI, a lancé Claude 2.1 aujourd’hui. La dernière version du rival ChatGPT augmente sa fenêtre contextuelle à 200 000 jetons, vous permettant de coller l’intégralité du message d’Homer. L’Odyssée pour l’analyse de l’IA. (Les jetons sont des morceaux de texte qu’elle utilise pour organiser les informations, et une fenêtre contextuelle est la limite définie de jetons qu’elle peut analyser en une seule requête.) La société a déclaré que la version 2.1 réduisait également de moitié le taux d’hallucinations de Claude, conduisant à moins de réponses erronées (comme celles l’avocat de ChatGPT faisait beaucoup trop confiance). Coïncidence ou non, la mise à jour arrive alors que le monde de la technologie regarde le rival d’Anthropic, OpenAI, sombrer dans le pandémonium.

La société affirme que la fenêtre contextuelle de 200 000 jetons de Claude 2.1 permet aux utilisateurs de télécharger des bases de code entières, des articles universitaires, des états financiers ou de longues œuvres littéraires. (Anthropic affirme que 200 000 jetons équivalent à environ 150 000 mots ou plus de 500 pages de matériel.) Après avoir téléchargé le matériel, le chatbot peut fournir des résumés, répondre à des questions spécifiques sur son contenu, comparer/opposer plusieurs documents ou reconnaître des modèles que les humains peuvent avoir plus de mal. voyant.

« Le traitement d’un message d’une longueur de 200 000 est une tâche complexe et une première dans l’industrie », a écrit la société dans un article de blog. « Même si nous sommes ravis de mettre cette nouvelle fonctionnalité puissante entre les mains de nos utilisateurs, les tâches qui nécessiteraient généralement des heures d’effort humain peuvent prendre quelques minutes à Claude. Nous nous attendons à ce que la latence diminue considérablement à mesure que la technologie progresse.

Anthropic prévient que l’analyse et la réponse à des entrées extrêmement longues pourraient prendre quelques minutes au robot IA, soit beaucoup plus longtemps que les secondes que nous devons généralement attendre pour des requêtes plus simples. « Nous nous attendons à ce que la latence diminue considérablement à mesure que la technologie progresse », a écrit la société.

Les hallucinations, ou informations manifestement inexactes, sont toujours répandues dans cette génération de chatbots IA. Cependant, Anthropic affirme que Claude 2.1 a réduit son taux d’hallucinations de moitié par rapport à Claude 2.0. L’entreprise attribue une partie des progrès à une meilleure capacité à séparer les affirmations incorrectes des aveux d’incertitude, ce qui rend Claude 2.1 environ deux fois plus susceptible d’admettre qu’il ne connaît pas de réponse plutôt que de fournir une mauvaise réponse.

Anthropic affirme que Claude 2.1 commet également 30 % d’erreurs en moins dans les documents extrêmement longs. De plus, le taux de « conclusion erronée d’un document à l’appui d’une affirmation particulière » est trois à quatre fois inférieur lorsqu’on utilise des fenêtres contextuelles plus robustes.

Le bot mis à jour ajoute également quelques avantages spécifiquement destinés aux développeurs. Une nouvelle console Workbench permet aux développeurs d’affiner les invites « dans une expérience de style terrain de jeu et d’accéder à de nouveaux paramètres de modèle pour optimiser le comportement de Claude ». Par exemple, il permet aux utilisateurs de tester plusieurs invites et d’exploiter la base de code de Claude pour générer des extraits pour les SDK. Une autre nouvelle fonctionnalité bêta pour les développeurs, « l’utilisation des outils », permet à Claude « de s’intégrer aux processus, produits et API existants des utilisateurs ». L’entreprise cite des exemples tels que l’utilisation d’une calculatrice pour des équations complexes, la traduction d’un langage simple en appels d’API structurés, l’utilisation d’une API de recherche sur le Web, l’exploitation des API privées des clients ou la connexion à des ensembles de données de produits. La société prévient que la fonctionnalité d’utilisation de l’outil en est à ses débuts et exhorte les clients à soumettre leurs commentaires.

Source-145