La bonne vieille IA reste viable malgré la montée en puissance des LLM

Vous vous souvenez d’il y a un an, en novembre dernier, avant que nous connaissions ChatGPT, lorsque l’apprentissage automatique consistait uniquement à créer des modèles à résoudre pour une seule tâche comme l’approbation de prêts ou la protection contre la fraude ? Cette approche a semblé disparaître avec la montée en puissance des LLM généralisés, mais le fait est que les modèles généralisés ne sont pas bien adaptés à tous les problèmes et que les modèles basés sur les tâches sont toujours bien vivants dans l’entreprise.

Jusqu’à l’avènement des LLM, ces modèles basés sur les tâches constituaient la base de la plupart des IA dans les entreprises, et ils ne vont pas disparaître. C’est ce que Werner Vogels, directeur technique d’Amazon, a qualifié de « bonne IA à l’ancienne » dans son discours de cette semaine et, à son avis, c’est le type d’IA qui résout encore de nombreux problèmes du monde réel.

Atul Deo, directeur général d’Amazon Bedrock, le produit introduit plus tôt cette année comme moyen de se connecter à une variété de grands modèles de langage via des API, estime également que les modèles de tâches ne vont pas simplement disparaître. Au lieu de cela, ils sont devenus un autre outil d’IA dans l’arsenal.

« Avant l’avènement des grands modèles de langage, nous étions principalement dans un monde spécifique à des tâches. Et l’idée était que vous formeriez un modèle à partir de zéro pour une tâche particulière », a déclaré Deo à TechCrunch. Il dit que la principale différence entre le modèle de tâches et le LLM est que l’un est formé pour cette tâche spécifique, tandis que l’autre peut gérer des choses en dehors des limites du modèle.

Jon Turow, associé de la société d’investissement Madrona, qui a passé près d’une décennie chez AWS, affirme que l’industrie a parlé des capacités émergentes dans les grands modèles de langage comme le raisonnement et la robustesse hors domaine. «Celles-ci vous permettent d’aller au-delà d’une définition étroite de ce que le modèle était initialement censé faire», a-t-il déclaré. Mais, a-t-il ajouté, la question de savoir jusqu’où ces capacités peuvent aller reste encore très controversée.

Comme Deo, Turow affirme que les modèles de tâches ne vont pas disparaître soudainement. « Il est clair que les modèles spécifiques à une tâche ont encore un rôle à jouer car ils peuvent être plus petits, ils peuvent être plus rapides, ils peuvent être moins chers et ils peuvent même dans certains cas être plus performants car ils sont conçus pour une tâche spécifique », a-t-il déclaré. .

Mais il est difficile d’ignorer l’attrait d’un modèle polyvalent. « Lorsque vous examinez le niveau global d’une entreprise, lorsque des centaines de modèles d’apprentissage automatique sont formés séparément, cela n’a aucun sens », a déclaré Deo. « Alors que si vous optez pour un grand modèle de langage plus performant, vous bénéficiez immédiatement de l’avantage de la réutilisabilité, tout en vous permettant d’utiliser un seul modèle pour aborder un ensemble de cas d’utilisation différents. »

Pour Amazon, SageMaker, la plate-forme d’opérations d’apprentissage automatique de l’entreprise, reste un produit clé, destiné aux scientifiques des données plutôt qu’aux développeurs, comme l’est Bedrock. Il fait état de dizaines de milliers de clients construisant des millions de modèles. Il serait imprudent d’y renoncer, et franchement, ce n’est pas parce que les LLM sont à la mode du moment que la technologie qui les a précédés ne restera pas pertinente pendant un certain temps.

Les logiciels d’entreprise en particulier ne fonctionnent pas de cette façon. Personne n’abandonne simplement son investissement important parce qu’une nouveauté est arrivée, même aussi puissante que la récolte actuelle de grands modèles de langage. Il convient de noter qu’Amazon a annoncé cette semaine des mises à niveau de SageMaker, visant directement à gérer de grands modèles de langage.

Avant ces grands modèles de langage plus performants, le modèle de tâches était vraiment la seule option, et c’est ainsi que les entreprises l’ont abordé, en constituant une équipe de data scientists pour aider à développer ces modèles. Quel est le rôle du data scientist à l’ère des grands modèles de langage où les outils s’adressent aux développeurs ? Turow pense qu’ils ont encore un travail clé à accomplir, même dans les entreprises qui se concentrent sur les LLM.

« Ils vont réfléchir de manière critique aux données, et c’est en fait un rôle qui ne cesse de croître, et non de diminuer », a-t-il déclaré. Quel que soit le modèle, Turow pense que les data scientists aideront les gens à comprendre la relation entre l’IA et les données au sein des grandes entreprises.

« Je pense que chacun d’entre nous doit vraiment réfléchir de manière critique à ce dont l’IA est ou n’est pas capable, et à ce que les données signifient et ne signifient pas », a-t-il déclaré. Et cela est vrai, que vous construisiez un grand modèle de langage plus généralisé ou un modèle de tâches.

C’est pourquoi ces deux approches continueront à fonctionner simultanément pendant un certain temps encore, car parfois, plus c’est gros, mieux c’est, et parfois non.

Source-146