Reddit s’apprête à récolter 60 millions de dollars par an dans le cadre d’un accord avec une société d’IA anonyme pour former les futurs modèles sur ses 20 ans de contenu généré par les utilisateurs.

Chatbot icon on the digital binary code background

Si vous avez déjà posté sur Reddit, il y a de fortes chances que vous aidiez à former la prochaine génération de modèles d’IA avec vos propres mots, images et mèmes, car la société vend l’accès à ses 20 ans de contenu pour 60 $. million. Je veux dire, il y a de fortes chances que vous ayez déjà été habitué à former des IA étant donné que Reddit figure déjà en grande partie dans les données de formation pour un tas de différents grands modèles de langage (LLM) et générateurs d’images, mais au moins maintenant quelques uns être payé pour cela.

Les modèles d’IA générative, tels que ChatGPT et Stable Diffusion, doivent être formés sur des bases de données comprenant des centaines de millions d’images, de livres, de clips vidéo, de musique, etc. Parfois, la source est accessible au public et ouverte à tous, et parfois les sociétés d’IA « empruntent » simplement ce qui traîne sur le Web. Mais il y a rarement de l’argent échangé entre les deux organismes. Ce n’est pas le cas avec Reddit, car il semble qu’il ait conclu un accord selon lequel, pour une bonne somme d’argent chaque année, un modèle d’IA peut utiliser le contenu du site à des fins de formation.

Source-67