Le vaste secteur des modèles de langage continue de gonfler alors que StabilityAI, fabricant de l’outil de génération d’images populaire Stable Diffusion, a lancé une suite d’outils de modèles de langage open source.
Baptisées StableLM, les versions alpha accessibles au public du suite contiennent actuellement des modèles comportant trois et sept milliards de paramètres avec des modèles de paramètres de 15, 30 et 65 milliards notés comme « en cours » et un modèle de 175 milliards prévu pour un développement futur.
Annonce de StableLM❗
Nous publions le premier de nos grands modèles de langage, en commençant par les modèles de paramètres 3B et 7B, avec 15-65B à suivre. Nos LLM sont publiés sous licence CC BY-SA.
Nous publions également des modèles réglés RLHF à des fins de recherche. En savoir plus→ https://t.co/R66Wa4gbnW pic.twitter.com/gvDDJMFBYJ
— IA de stabilité (@StabilityAI) 19 avril 2023
En comparaison, GPT-4 a un nombre de paramètres estimé à mille milliards, six fois plus élevé que son prédécesseur GPT-3.
Cependant, le nombre de paramètres peut ne pas être une mesure uniforme de l’efficacité du LLM, comme l’a noté Stability AI dans son blog. poste annonçant le lancement de StableLM :
« StableLM est formé sur un nouvel ensemble de données expérimental construit sur The Pile, mais trois fois plus grand avec 1,5 billion de jetons de contenu […] La richesse de cet ensemble de données confère à StableLM des performances étonnamment élevées dans les tâches de conversation et de codage, malgré sa petite taille de 3 à 7 milliards de paramètres.
On ne sait pas exactement à quel point les modèles StableLM sont robustes. L’équipe StabilityAI a noté sur la page Github de l’organisation que plus d’informations sur les capacités des LM seraient à venir, y compris les spécifications du modèle et les paramètres de formation.
En rapport: Microsoft développe sa propre puce AI pour alimenter ChatGPT
À condition que les modèles fonctionnent suffisamment bien lors des tests, l’arrivée d’une puissante alternative open source au ChatGPT d’OpenAI pourrait s’avérer intéressante pour le monde du commerce des crypto-monnaies.
Comme Cointelegraph l’a rapporté, les gens construisent des bots de trading avancés en plus de l’API GPT et de nouvelles variantes qui intègrent l’accès à des outils tiers, tels que BabyAGI et AutoGPT.
L’ajout de modèles open source dans le mix pourrait être une aubaine pour les commerçants férus de technologie qui ne veulent pas payer l’accès à OpenAI primes.
Les personnes intéressées peuvent tester une interface en direct pour le modèle StableLM à paramètres 7B hébergé sur HuggingFace. Cependant, au moment de la publication de cet article, nos tentatives pour le faire ont trouvé le site Web débordé ou à pleine capacité.