samedi, décembre 21, 2024

La désinformation COVID est le plus grand défi pour le programme Birdwatch de Twitter, selon les données

Depuis le 6 octobre, le programme de modération de la communauté Birdwatch de Twitter a été étendu à tous les utilisateurs américains.

C’est un grand pas pour Birdwatch, qui a été officiellement lancé en version bêta en janvier 2021, et marque une étape supplémentaire dans les efforts de la plateforme pour réduire la propagation de la désinformation sur la plateforme. Mais à mesure que le système se développe, les données examinées par Le bord suggère que les sujets les plus courants faisant l’objet d’une vérification des faits sont déjà couverts par les politiques de désinformation de Twitter, ce qui soulève de nouvelles questions quant à l’impact global du programme.

À la base, la promesse de Birdwatch est de « décentraliser » le processus de vérification des informations erronées, en mettant le pouvoir entre les mains de la communauté d’utilisateurs plutôt qu’une entreprise technologique. Mais la vérification des faits englobe un large éventail de sujets, allant des rumeurs triviales et facilement démystifiées aux affirmations complexes qui peuvent dépendre d’incertitudes fondamentales dans le processus scientifique.

« Cela peut parler des curiosités aléatoires d’Internet qui surgissent »

Dans des déclarations publiques, les dirigeants de Twitter impliqués dans le programme se sont concentrés sur les décisions les plus faciles. Lors d’un appel avec des journalistes le mois dernier, Keith Coleman, vice-président des produits chez Twitter, a suggéré que la force de Birdwatch était de traiter les déclarations qui n’étaient pas couvertes par les politiques de désinformation de Twitter ou qui n’étaient pas suffisamment sérieuses pour être attribuées en interne. Vérification des ressources. « Cela peut parler des curiosités aléatoires d’Internet qui surgissent », Gizmodo cite Coleman comme dit. « Par exemple, y a-t-il un vide géant dans l’espace ? Ou, cette chauve-souris a-t-elle réellement la taille d’un humain ? »

MÉTHODOLOGIE

Nous avons téléchargé les données Birdwatch jusqu’au 20 septembre. Cet ensemble de données contenait 37 741 notes au total, dont 32 731 étaient uniques.

Nous avons utilisé Python trousse d’outils de langage naturel bibliothèque pour analyser les notes et extraire les mots significatifs les plus courants qui y figurent.

Pour ce faire, nous avons écarté les conjonctions telles que « et », « mais », « là », « qui » ​​et « à propos » et exclu les mots fréquemment utilisés dans le processus de vérification des faits, tels que « tweet, » « source », « affirmations », « preuves » et « article ». Nous avons également ignoré les mots à l’intérieur des URL – que Twitter inclut dans le texte de la note – et avons réduit les pluriels à leur forme singulière (ainsi, « voitures » serait comptée comme « voiture »).

Les données traitées nous donnent un bon aperçu des sujets qui sont couramment abordés ou auxquels un contexte a été ajouté à l’aide du système Birdwatch.

➡️ Pour explorer vous-même toutes les données, vous pouvez parcourir notre base de données interactive de notes Birdwatch.

Mais les cas de la phase bêta du programme montrent que de nombreux utilisateurs de Birdwatch tentent de résoudre des problèmes de désinformation plus graves sur la plate-forme et se chevauchent de manière significative avec les politiques existantes de Twitter. Les données Birdwatch publiées par Twitter montrent que les sujets liés au COVID sont de loin le sujet le plus couramment abordé dans les notes Birdwatch. De plus, de nombreux comptes qui ont publié les tweets annotés ont depuis été suspendus, ce qui suggère que le processus d’examen interne de Twitter détecte les violations de contenu et prend des mesures.

Dans le cadre de ses efforts open source plus larges, Twitter maintient une mise à jour régulière ensemble de données de toutes les notes Birdwatch est téléchargeable gratuitement sur le blog du projet. Le bord a analysé ces données, en parcourant un ensemble de données qui s’étendait du 22 janvier 2021 au 20 septembre 2022. En utilisant des outils informatiques pour rassembler et résumer les données, nous pouvons avoir un aperçu des principaux sujets des notes Birdwatch qui seraient difficiles à obtenir de l’examen manuel.

Les données montrent que les utilisateurs de Birdwatch ont passé beaucoup de temps à examiner les tweets liés au COVID, à la vaccination et à la réponse du gouvernement à la pandémie. La liste de fréquence des mots nous montre que « COVID » est le terme de sujet le plus courant, le terme connexe « vaccin » se classant au troisième rang de la liste.

Parmi ces notes, le type d’allégations faisant l’objet d’une vérification des faits évolue au fil du temps à mesure que la compréhension du public sur la pandémie change. Les tweets de 2021 traitent de faux récits affirmant que le Dr Anthony Fauci d’une manière ou d’une autre avait un rôle personnel à créer le nouveau coronavirus ou à lever le doute sur l’innocuité et l’efficacité des vaccins au fur et à mesure qu’ils devenaient disponibles.

D’autres notes de Birdwatch de cette époque traitent de traitements non prouvés ou dangereux pour le COVID, comme l’ivermectine et l’hydroxychloroquine.

Capture d'écran d'un tweet de @HoodHealer lisant :

Alors que certains des mythes COVID les plus farfelus sont faciles à vérifier – comme l’idée que le virus était un canular, est pour la plupart inoffensif ou se propage par les tours 5G – d’autres affirmations sur la transmission, la gravité et la mortalité peuvent être plus difficiles à définitivement corriger.

Par exemple, alors que les vaccins étaient déployés en janvier 2021, un utilisateur de Birdwatch a tenté de mettre en contexte un argument sur l’efficacité d’une marque de vaccin pour prévenir l’hospitalisation par rapport à la prévention de toute infection. Gouverneur du New Jersey Phil Murphy tweeté que les données d’essai pour le vaccin Johnson & Johnson ont montré une « protection COMPLÈTE contre l’hospitalisation et la mort » et ont provoqué une réaction de colère d’un statisticien qui s’est lié aux données d’essai montrant seulement « 66% d’efficacité » du vaccin.

« La [tweet] l’auteur confond l’efficacité rapportée de la prévention des hospitalisations et des décès avec l’efficacité globale rapportée de la prévention des infections », a ajouté utilement une note de Birdwatch, faisant référence à Bloomberg couverture qui distinguaient clairement les métriques.

Plus discutablement, un autre utilisateur de Birdwatch a tenté de vérifier une affirmation largement rapportée par les médias grand public, en utilisant un article de blog sur un site Web de préparation comme citation. Où les médias ont suivi l’exemple du CDC en signalant que la variante omicron représentaient 73% des nouvelles infections en décembre 2021, un article de blog sur ThePrepared.com a fait valoir que la réclamation pouvait provenir d’une erreur dans la modélisation statistique du CDC. Le billet de blog a été bien argumenté, mais sans confirmation d’une source plus fiable et vérifiée, il est difficile de savoir si l’annotation a aidé la situation ou simplement brouillé les eaux.

Les utilisateurs de Birdwatch ont évalué les tweets comme ceux-ci comme étant parmi les plus problématiques à traiter. (En remplissant un sondage lors de la création d’une note, les utilisateurs peuvent évaluer les tweets sur quatre valeurs binaires qualifiant à quel point les affirmations sont trompeuses, crédibles, nuisibles et difficiles à vérifier). Il est clair que la communication précise et accessible des découvertes scientifiques est une tâche difficile, mais les résultats en matière de santé publique dépendent de la diffusion de conseils de santé précis et de la prévention de la prolifération des mauvais conseils. Les experts conviennent que les plateformes ont besoin de normes fortes, claires et coordonnées pour lutter contre la désinformation sur la pandémie, et il semble peu probable que la modération communautaire atteigne cette barre.

Bien que COVID soit un sujet principal des notes de Birdwatch, il est loin d’être le seul.

Dans la liste des fréquences de mots, « tremblement de terre » et « prédiction » occupent une place de choix en raison d’un grand nombre de notes rédigées de manière identique qui étaient jointes aux tweets de comptes prétendant à tort pouvoir prédire les tremblements de terre dans le monde.

Il n’y a aucune preuve que les tremblements de terre peuvent être prédits de manière fiable, mais des prévisions de tremblement de terre inexactes continuez à devenir viral en ligne. Avec 48 000 abonnés au moment de la rédaction, le compte Twitter @Quakeprediction est l’un des pires contrevenants, affichant un flux constant de prédictions de risque de tremblement de terre élevé en Californie. Un utilisateur de Birdwatch semble avoir pris sur lui de joindre une note d’avertissement à plus de 1 300 tweets de ce compte et d’autres comptes de prédiction de tremblement de terre, chaque fois en lien avec une démystification de l’US Geological Survey expliquant que les scientifiques n’ont jamais prédit un tremblement de terre.

On ne sait pas pourquoi l’utilisateur s’est concentré sur les tremblements de terre, mais le résultat final est un critique humain se comportant ironiquement plus comme un logiciel automatisé de vérification des faits : rechercher un modèle dans les tweets et répondre avec une action identique à chaque fois.

Arrêter « Arrêtez le vol »

Les données montrent également clairement les efforts en cours pour contester les résultats des élections de 2020 – un phénomène qui a tourmenté de nombreuses autres plateformes en ligne.

Plus bas dans la liste des mots les plus courants se trouvent les termes « Trump », « élection » et « Biden ». De nombreuses notes contenant ces termes traitent des affirmations selon lesquelles Donald Trump a remporté les élections de 2020 ou, au contraire, que Joe Biden a perdu. Bien qu’omniprésentes, de telles affirmations sont faciles à vérifier en raison de la quantité écrasante de preuves contre la fraude électorale généralisée.

« Joe Biden a remporté l’élection. C’est le gros mensonge continué », lit-on dans une note jointe à un tweeter par lié aux nationalistes blancs La sénatrice de l’État de l’Arizona, Wendy Rogers, qui prétend à tort que des fraudes ont eu lieu dans des zones très peuplées.

« La fraude par vote par correspondance est presque impossible à commettre, et il n’y a absolument aucune preuve que les résultats des élections de 2020 sont le résultat d’une fraude », lit-on dans une autre note jointe à un faux tweet par Irene Armendariz-Jackson, candidate républicaine à l’ancien siège du Congrès de Beto O’Rourke à El Paso, Texas.

Un autre utilisateur a simplement écrit : « L’élection n’a pas été truquée. Trump a perdu. Pour cette note, comme dans de nombreux autres cas, les tweets originaux ne peuvent tout simplement pas être examinés : la recherche de l’ID de tweet entraîne une page vierge et un message indiquant que le compte a été suspendu.

Alors que les utilisateurs de Birdwatch ont annoté de nombreux tweets contestant les résultats des élections de 2020, les enquêtes d’auto-évaluation évaluent ces tweets comme étant moins difficiles à traiter, étant donné la quantité écrasante de preuves soutenant la victoire de Biden.

Compte tenu du grand nombre de comptes suspendus, il semble clair que les algorithmes de Twitter ou son équipe de modération humaine trouvent également facile de signaler et de supprimer le même contenu.

Capture d'écran d'un tweet de @StateofusAll lisant :

Jusqu’à présent, les données du programme Birdwatch montrent une forte communauté de vérificateurs de faits bénévoles qui tentent de résoudre des problèmes difficiles. Mais les preuves suggèrent également un large degré de chevauchement entre le type de tweets auxquels ces volontaires s’adressent et le contenu déjà couvert par les politiques de désinformation existantes de Twitter, ce qui soulève des questions quant à savoir si les notes de vérification des faits auront un impact significatif. (Twitter soutient que Birdwatch devrait s’ajouter aux initiatives de vérification des faits existantes plutôt qu’à tout type de remplacement des contrôles de désinformation.)

Twitter affirme que les résultats préliminaires du programme semblent bons : la société affirme que les personnes qui voient des notes de vérification des faits jointes aux tweets sont 20 à 40 % moins susceptibles d’être d’accord avec la substance d’un tweet potentiellement trompeur que quelqu’un qui ne voit que le tweet. C’est une découverte prometteuse, mais par implication, de nombreux téléspectateurs du tweet sont toujours dupés par des mensonges.

Twitter n’a pas immédiatement répondu à une demande de commentaire.

Cliquez ici pour parcourir notre base de données interactive de notes Birdwatch.


source site-132

- Advertisement -

Latest