vendredi, décembre 27, 2024

Anthropic lance une version améliorée de son LLM d’entrée de gamme

Anthropic, la startup d’IA cofondée par d’anciens dirigeants d’OpenAI, a publié une version mise à jour de son modèle de génération de texte plus rapide et moins cher disponible via une API, Claude Instant.

Le Claude Instant mis à jour, Claude Instant 1.2, intègre les points forts du modèle phare d’Anthropic récemment annoncé, Claude 2, montrant des gains « significatifs » dans des domaines tels que les mathématiques, le codage, le raisonnement et la sécurité, selon Anthropic. Lors des tests internes, Claude Instant 1.2 a obtenu 58,7 % sur un benchmark de codage par rapport à Claude Instant 1.1, qui a obtenu 52,8 %, et 86,7 % sur un ensemble de questions mathématiques contre 80,9 % pour Claude Instant 1.1.

« Claude Instant génère des réponses plus longues et plus structurées et suit mieux les instructions de formatage », écrit Anthropic dans un article de blog. « Instant 1.2 montre également des améliorations dans l’extraction de citations, les capacités multilingues et la réponse aux questions. »

Claude Instant 1.2 est également moins susceptible d’halluciner et plus résistant aux tentatives de jailbreak, affirme Anthropic. Dans le contexte de grands modèles de langage comme Claude, « l’hallucination » est l’endroit où un modèle génère un texte incorrect ou absurde, tandis que le jailbreak est une technique qui utilise des invites intelligemment écrites pour contourner les dispositifs de sécurité placés sur les grands modèles de langage par leurs créateurs.

Et Claude Instant 1.2 propose une fenêtre contextuelle de la même taille que celle de Claude 2 – 100 000 jetons. La fenêtre contextuelle fait référence au texte que le modèle considère avant de générer du texte supplémentaire, tandis que les jetons représentent le texte brut (par exemple, le mot « fantastique » serait divisé en jetons « fan », « tas » et « tic »). Claude Instant 1.2 et Claude 2 peuvent analyser environ 75 000 mots, soit environ la longueur de « The Great Gatsby ».

De manière générale, les modèles avec de grandes fenêtres contextuelles sont moins susceptibles « d’oublier » le contenu des conversations récentes.

Comme nous l’avons signalé précédemment, l’ambition d’Anthropic est de créer un « algorithme de nouvelle génération pour l’auto-apprentissage de l’IA », comme il le décrit dans un pitch deck aux investisseurs. Un tel algorithme pourrait être utilisé pour créer des assistants virtuels capables de répondre aux e-mails, d’effectuer des recherches et de générer des œuvres d’art, des livres, etc., dont certains que nous avons déjà goûtés avec GPT-4 et d’autres grands modèles de langage.

Mais Claude Instant n’est pas cet algorithme. Au contraire, il est destiné à concurrencer les offres d’entrée de gamme similaires d’OpenAI ainsi que des startups telles que Cohere et AI21 Labs, qui développent et produisent leurs propres systèmes d’IA générant du texte et, dans certains cas, des images.

À ce jour, Anthropic, qui a été lancé en 2021, dirigé par l’ancien vice-président de la recherche d’OpenAI, Dario Amodei, a levé 1,45 milliard de dollars à une valorisation en milliards à un chiffre. Bien que cela puisse sembler beaucoup, c’est bien en deçà de ce dont l’entreprise estime avoir besoin – 5 milliards de dollars au cours des deux prochaines années – pour créer son chatbot envisagé.

Anthropic prétend avoir actuellement des « milliers » de clients et de partenaires, y compris Quora, qui donne accès à Claude et Claude Instant via son application d’IA générative basée sur un abonnement Poe. Claude alimente l’outil DuckAssist récemment lancé par DuckDuckGo, qui répond directement aux requêtes de recherche simples des utilisateurs, en combinaison avec ChatGPT d’OpenAI. Et sur Notion, Claude fait partie du backend technique de Notion AI, un assistant d’écriture IA intégré à l’espace de travail Notion.

Source-146

- Advertisement -

Latest