Entreprises d’IA à la recherche de données produites par l’IA pour une formation récursive

Il semble que les sociétés d’IA telles que Microsoft, OpenAI et Cohere fassent tout ce qu’elles peuvent pour trouver des données synthétiques avec lesquelles former leurs produits d’IA. Citant la disponibilité limitée de données « organiques » générées par l’homme sur le World Wide Web, ces entreprises visent à utiliser les données (synthétiques) générées par l’IA dans une sorte de boucle infinie, où la formation est réalisée sur des données déjà créées de manière générative.

« Si vous pouviez obtenir toutes les données dont vous avez besoin sur le Web, ce serait fantastique », a déclaré Aidan Gomez, directeur général de Cohere, une start-up LLM de 2 milliards de dollars, au Financial Times. « En réalité, le Web est tellement bruyant et désordonné qu’il n’est pas vraiment représentatif des données que vous voulez. Le Web ne fait tout simplement pas tout ce dont nous avons besoin.

Source-138