jeudi, décembre 19, 2024

Le chatbot Grok de X recevra bientôt un modèle amélioré, Grok-1.5

La startup d’IA d’Elon Musk, X.ai, a dévoilé son dernier modèle d’IA générative, Grok-1.5. Destiné à alimenter le chatbot Grok du réseau social X dans un avenir pas si lointain (« dans les prochains jours », selon un article de blog), Grok-1.5 semble être une mise à niveau mesurable par rapport à son prédécesseur, Grok-1 – du moins à en juger. par les résultats et les spécifications de référence publiés.

Grok-1.5 bénéficie d’un « raisonnement amélioré », selon X.ai, en particulier lorsqu’il s’agit de tâches de codage et liées aux mathématiques. Le modèle a plus que doublé le score de Grok-1 à un test mathématique populaire, MATH, et a obtenu un score supérieur de plus de 10 points de pourcentage au test HumanEval sur la génération de langages de programmation et les capacités de résolution de problèmes.

Il est difficile de prédire comment ces résultats se traduiront dans une utilisation réelle. Comme nous l’avons récemment écrit, les benchmarks d’IA couramment utilisés, qui mesurent des choses aussi ésotériques que les performances aux questions d’examen de chimie de niveau supérieur, ne parviennent pas à capturer la façon dont la personne moyenne interagit avec les modèles aujourd’hui.

Une amélioration qui devrait conduire à des gains observables est la quantité de contexte que Grok-1.5 peut comprendre par rapport à Grok-1.

Grok-1.5 peut traiter des contextes allant jusqu’à 128 000 jetons. Ici, « jetons » fait référence à des morceaux de texte brut (par exemple, le mot « fantastique » divisé en « fan », « tas » et « tic »). Le contexte, ou fenêtre contextuelle, fait référence aux données d’entrée (dans ce cas, du texte) qu’un modèle prend en compte avant de générer une sortie (plus de texte). Les modèles dotés de petites fenêtres contextuelles ont tendance à oublier le contenu des conversations, même très récentes, tandis que les modèles dotés de contextes plus larges évitent cet écueil et, comme avantage supplémentaire, comprennent mieux le flux de données qu’ils absorbent.

« [Grok-1.5 can] utiliser des informations provenant de documents beaucoup plus longs », écrit X.ai dans le billet de blog. « De plus, le modèle peut gérer des invites plus longues et plus complexes tout en conservant sa capacité de suivi des instructions à mesure que sa fenêtre contextuelle s’agrandit. »

Ce qui distingue historiquement les modèles Grok de X.ai des autres modèles d’IA générative, c’est qu’ils répondent à des questions sur des sujets qui sont généralement interdits aux autres modèles, comme les complots et les idées politiques plus controversées. Les modèles répondent également aux questions avec « un côté rebelle », comme l’a décrit Musk, et avec un langage carrément grossier si on leur demande de le faire.

On ne sait pas quels changements, le cas échéant, Grok-1.5 apporte dans ces domaines. X.ai n’y fait pas allusion dans le billet de blog.

Grok-1.5 sera bientôt disponible pour les premiers testeurs sur X, accompagné de « plusieurs nouvelles fonctionnalités ». Musk a déjà fait allusion à la nécessité de résumer les fils de discussion et les réponses, et de suggérer du contenu pour les publications ; nous verrons si ceux-ci arriveront assez tôt.

L’annonce intervient après le Grok-1 open source de X.ai, mais sans le code nécessaire pour le peaufiner ou le former davantage. Plus récemment, Musk a déclaré que davantage d’utilisateurs sur X – en particulier ceux payant pour le forfait Premium de X à 8 $ par mois – auraient accès au chatbot Grok, qui n’était auparavant disponible que pour les clients X Premium+ (qui paient 16 $ par mois).

Source-146

- Advertisement -

Latest