Wikipédia est peut-être la ressource incontournable sur presque tout ces jours-ci, mais selon Meta, il est rempli de citations douteuses et inexactes.
Mais ne vous inquiétez pas, la société affirme que son IA est là pour vous aider, ayant développé Sphere, un modèle capable de scanner automatiquement des centaines de milliers de citations à la fois pour vérifier si elles soutiennent vraiment les affirmations correspondantes.
Meta affirme avoir créé un nouvel ensemble de données de 134 millions de pages Web publiques en tant que source de connaissances pour le modèle, qui est « d’un ordre de grandeur plus grand et nettement plus complexe que jamais utilisé pour ce type de recherche ».
Sphère (s’ouvre dans un nouvel onglet) utilise des données Web ouvertes plutôt que des moteurs de recherche propriétaires traditionnels tels que Google, et a déjà compilé 134 millions de documents sur le Web.
Construit à l’aide de CCNet (s’ouvre dans un nouvel onglet)une variante de Common Crawl, Meta dit que Sphere aidera d’autres chercheurs en IA travaillant sur des projets de récupération de connaissances.
Meta indique que l’objectif final du projet est de créer une plate-forme pour aider les éditeurs de Wikipédia à repérer systématiquement les problèmes de citation et à corriger rapidement la citation ou à corriger le contenu de l’article correspondant à grande échelle.
L’outil attirerait l’attention sur les citations douteuses, permettant aux éditeurs humains d’évaluer les cas les plus susceptibles d’être défectueux sans avoir à passer au crible des milliers de déclarations correctement citées.
Si une citation semble non pertinente, Meta dit que son modèle suggérera une source plus applicable, pointant même vers le passage spécifique qui soutient la revendication.
La nouvelle survient alors que Wikipédia cherche de nouvelles façons de générer des revenus autres que les dons.
L’entreprise Wikimédia (s’ouvre dans un nouvel onglet) La plate-forme a récemment annoncé qu’elle commencerait à facturer des entreprises telles que Google, Amazon et Facebook qui utilisent Wikipédia comme ressource.
Vous pouvez récupérer le code source du projet sur GitHub ici (s’ouvre dans un nouvel onglet)et les parties intéressées peuvent également lire un compte rendu complet des conclusions du projet ici (s’ouvre dans un nouvel onglet) ou accédez à la démo ici (s’ouvre dans un nouvel onglet).