Comment les algorithmes de Facebook décident de ce que vous voyez dans votre fil d’actualité

Cette pièce fait partie des efforts continus de Gizmodo pour rendre les papiers Facebook accessibles au public. Voir le répertoire complet des documents ici.

Dans une présentation datée du 6 mai 2018, un employé de Facebook a demandé : « Le classement est-il bon ?

« Probablement. Même poser la question semble légèrement blasphématoire sur Facebook », a répondu le même employé dans un texte plus petit ci-dessous. « Tant d’expériences et de lancements de produits démontrent la valeur du classement qu’il est [sic] la valeur est souvent considérée comme un article de foi.

Le « classement » fait référence à la façon dont le plus grand réseau social du monde hiérarchise le contenu que les utilisateurs voient dans le fil d’actualité, le produit phare de Facebook. La liste des messages que les utilisateurs voient lorsqu’ils ouvrent Facebook pour la première fois était autrefois dans un ordre chronologique simple ; désormais, les algorithmes conçus par l’entreprise organisent les publications en fonction de la valeur qui leur est attribuée. L’employé a frappé au cœur d’une question centrale au sein de Facebook, désormais connue sous le nom de Meta : comment équilibrer la maximisation des profits et de la croissance avec des comportements encourageants que les concepteurs d’algorithmes savaient n’étaient pas sains. Les algorithmes de classement de l’entreprise ont augmenté le temps que les utilisateurs passent sur Facebook, mais les employés ont constaté que cela favorisait de pires amitiés, selon le diaporama. Alors, le classement est-il bon ? Autrement dit : le classement vaut-il ses conséquences ?

La présentation fait partie de les papiers Facebook, une mine de documents qui offrent un aperçu sans précédent de l’entreprise de médias sociaux la plus puissante au monde. Les dossiers ont d’abord été fournis au Congrès l’année dernière par Frances Haugen, un chef de produit Facebook devenu lanceur d’alerte, et obtenu plus tard par des centaines de journalistes, dont ceux de Gizmodo. Haugen a témoigné devant le Congrès des méfaits de Facebook en octobre 2021.

Aujourd’hui, dans le cadre d’un effort continu pour rendre les Facebook Papers disponible publiquement, Gizmodo publie un deuxième lot de documents – 37 fichiers en tout. Dans notre première goutte, nous avons partagé 28 fichiers lié à l’élection de 2020 et à l’attaque du 6 janvier contre le Capitole des États-Unis. Seulement un quelques pages avait jamais été montré au public avant que. Gizmodo a en partenariat avec un groupe d’experts indépendants pour réviser, expurger et publier les documents. Ce comité sert à conseiller et à surveiller notre travail et à faciliter la divulgation responsable du plus grand nombre de documents dans l’intérêt public possible. Nous croyons en la valeur du libre accès à ces documents. Notre objectif collectif est de minimiser tout préjudice potentiel pouvant résulter de la divulgation de certaines méthodes par lesquelles Meta s’attaque à des problèmes sensibles tels que le trafic sexuel, la désinformation et la manipulation des électeurs.

Le lot d’aujourd’hui offre un aperçu de la façon dont Meta choisit de classer le contenu soumis par ses utilisateurs. C’est un système que très peu de gens semblent comprendre, un problème que l’entreprise semble manquer d’indices pour résoudre. Le choix de ces documents pour faire suite à ceux sur les événements politiques les plus importants des deux dernières années montre à quel point nous considérons leur pertinence pour comprendre les effets de Facebook sur le monde.

Ces documents offrent un aperçu non filtré, bien que fragmenté, des années de tentatives de Facebook pour attribuer une valeur émotionnelle à chaque balayage et clic dans son application. Ce processus, qui a un impact démesuré sur les types d’informations les plus fréquemment vues sur la plateforme, est connu sous le nom de classement. Il sous-tend l’une des principales fonctionnalités de Facebook : le fil d’actualités (ou simplement le « flux », comme l’entreprise préfère maintenant que nous l’appelions).

Plusieurs documents clés concernent ce que Facebook appelle des «interactions sociales significatives», un terme introduit par la société en janvier 2018. Cette métrique, en tant que PDG Mark Zuckerberg expliqué à l’époque, était censé aider à donner la priorité aux « connexions personnelles » par rapport à un dribble en ligne sans fin de nouvelles et de vidéos virales. Ce « changement majeur », comme il l’a dit, a été conçu comme un effort pour donner la priorité au « bonheur et à la santé » de l’utilisateur – la manière de Facebook d’encourager les utilisateurs à consulter Facebook plus souvent en augmentant le sentiment de connexion personnelle à leurs flux. .

Qu’est-ce qui constitue une interaction sociale significative ? La formulation de Meta semble intentionnellement opaque : il peut s’agir de partager une bière fraîche avec un vieil ami ou peut-être un repas avec toute la famille sous le même toit. Pour Facebook, c’est un problème mathématique ; un moyen de former un ordinateur pour attribuer un certain degré de valeur aux comportements en ligne les plus bénins – en mettant Un autocollantpar exemple, sur le message d’un cinglé au hasard.

Zuckerberg a démenti avant le Congrès que « l’augmentation du temps que les gens passent » à regarder leurs flux a toujours été l’objectif de Facebook. C’est une affirmation qui va à l’encontre de tout ce que nous savons de son entreprise et les mots de son propre premier adjoint. En fait, les informations financières de Meta ont pendant des années averti investisseurs des éléments suivants : « Si nous ne parvenons pas à conserver les utilisateurs existants ou à ajouter de nouveaux utilisateurs, ou si nos utilisateurs diminuent leur niveau d’engagement avec nos produits, nos revenus, nos résultats financiers et nos activités pourraient être considérablement affectés. » (C’est nous qui soulignons.) En février, Facebook a perdu des centaines de milliards en valeur boursière suite à des informations selon lesquelles son nombre d’utilisateurs actifs a chuté pour la première fois. L’entreprise a tout intérêt à acquérir de nouveaux utilisateurs et à augmenter le temps que les utilisateurs existants passent sur le réseau social.

En ce qui concerne le classement, les documents ci-dessous contiennent une admission d’un employé qui indique le dilemme de Facebook entre la croissance et la santé des utilisateurs. L’employé a écrit que les preuves en faveur du classement sont « vastes et presque universelles ». Les gens préfèrent les flux classés aux flux chronologiques. Selon l’employé, « l’utilisation et l’engagement chutent immédiatement » partout où le classement du flux est désactivé. L’utilisation accrue a cependant un prix. La qualité de l’expérience globale de l’utilisateur diminue. L’employé poursuit en affirmant que, bien que les flux modifiés stimulent indéniablement la « consommation » – le code interne de Facebook pour le temps passé sur Facebook – ils modifient également la dynamique de « l’amitié » pour décourager le « partage personnel ».

« Plus l’algorithme de classement est bon, plus le coût des ‘mauvaises’ amitiés est faible », écrit l’employé, notant que les utilisateurs qui n’ont pas d’intérêts communs ne verront probablement pas très souvent les messages des autres. « En réduisant le coût de l’amitié à près de zéro, le classement modifie la sémantique de l’amitié de » Je me soucie de toi » à « Je pourrais éventuellement me soucier de quelque chose que vous partagez un jour. »»

En d’autres termes, le classement encourage le partage de moins significative messages, tout en permettant « au mauvais contenu de se propager plus loin en raison de l’accumulation gratuite d’amis », selon la présentation. Le sentiment n’est cependant pas universel au sein de Facebook : les employés dans les commentaires n’étaient pas d’accord.

Ce que ces documents nous montrent, c’est que, malgré tout Facebook qui se tord la main sur ce qu’il pense être «significatif» pour les utilisateurs ou «digne de leur temps», en interne, les employés considèrent le classement comme beaucoup trop complexe, trop incompréhensible, pour jamais obtenir le travail bien fait. Ils savent aussi que c’est un système dont dépend l’avenir de Facebook.


Explications liées au classement

Un document où un employé s’exprime de façon poétique sur le « but » des flux, à la fois pour les utilisateurs de Facebook et pour le monde entier.

Encore un document poétique. Spoiler : la réponse est « parfois, pour certaines personnes ».

Plate-forme liée au classement et mises à jour de produits

Un document annonçant une nouvelle expérience de classement destinée à réduire « le contenu incendiaire et la désinformation » dans les pays à haut risque, comme le Sri Lanka et l’Éthiopie.

Un document annonçant une nouvelle expérience de classement concernant le contenu « civique » ou politique, destiné à augmenter davantage de contenu qui « vaut le temps de l’utilisateur ».

Propositions liées au classement

Ce document propose une nouvelle façon, quelque peu ésotérique, de penser en interne les « producteurs » et les « consommateurs » de contenu dans les flux des personnes.

Articles traitant des « rétrogradations » dans les flux

Un explicateur de 2020 sur certaines des façons relativement nouvelles dont l’entreprise mesure l’efficacité globale des rétrogradations.

Un indicateur interne de 2021 notant que certaines rétrogradations ne sont pas aussi précises qu’elles devraient l’être, en partie à cause de la dépendance du système actuel aux URL.

Un document décrivant les stratégies potentielles pour être plus transparent sur les rétrogradations.

Un document expliquant pourquoi la transparence sur les rétrogradations dans les flux des personnes ne fait pas nécessairement comprendre aux utilisateurs à quel point ces rétrogradations sont « légitimes » ou « justifiées ».

Un avis interne clarifiant à quel point l’entreprise doit être « transparente » sur les rétrogradations de contenu dans les pays du Sud. La réponse est « pas très ! »

Un drapeau interne sur les restrictions, les « shadowbans » et les rétrogradations frappant de manière disproportionnée le contenu discutant de la Palestine.

Un document dans lequel un employé explique ce que signifie être « silencieux » et « avoir une voix » sur la plate-forme en ce qui concerne le classement.

Les résultats d’une expérience au cours de laquelle l’entreprise a testé la rétrogradation des commentaires « de type troll » sur les publications des utilisateurs.

Un document décrivant les compromis entre le contenu qui vaut le temps des gens (via des métriques internes) et le contenu rétrogradé.

Une chronologie des innombrables expériences de rétrogradation de l’entreprise à partir du second semestre 2020.

Un document de 2020 annonçant un prochain changement de classement du contenu politique lié à la santé.

Un audit interne du travail existant de l’entreprise dans l’espace des rétrogradations.

Un document décrivant comment l’entreprise doit mesurer et minimiser les « dommages collatéraux » qui peuvent survenir aux flux des personnes suite à des rétrogradations.

Idées potentielles de rétrogradations qui pourraient dissuader les mauvais acteurs de publier du mauvais contenu digne d’être rétrogradé.

Articles traitant des « interactions sociales significatives » (MSI)

Une série de notes expliquant tout sur « MSI ». Les parties un et trois contiennent des informations sensibles sur Meta, elles ont donc été omises.

Une liste interne de « liens utiles » pour expliquer ce que sont les « interactions sociales significatives » et comment l’entreprise les mesure.

Un court résumé expliquant certaines des bases de la définition de la «signification» sur une base post par post.

Deux documents décrivant une expérience interne menée après que l’entreprise a modifié sa métrique MSI interne à la mi-2018, en examinant spécifiquement la réponse globale de l’utilisateur.

Un aperçu de la façon dont MSI est mesuré pour les pages petites et grandes.

Une note demandant dans quelle mesure les comportements de publication de « spam » contribuent à la définition de l’entreprise des « interactions sociales significatives ».

Une note décrivant comment l’entreprise prévoit d’empêcher les «appâts d’engagement» (également appelés appâts à clics), «l’intimidation» et le comportement des commentaires indésirables de contribuer à la métrique MSI.

Un test interne de réduction de l’impact des réactions « en colère » sur le classement et les rétrogradations.

Des mémos de 2020 annonçant des changements à venir dans la façon dont les MSI ont été mesurés, destinés à capturer des publications et des commentaires plus « significatifs » ou « utiles ».

Un forum ouvert interne demandant si l’entreprise devrait repenser la façon dont elle mesure les « autocollants » dans les commentaires, et peut-être les rendre moins « significatifs ».

Une note détaillant les résultats d’une expérience sur la façon dont le « repartage » est calculé en termes de MSI.

Papiers divers

Un employé déplorant la perte d’un outil interne qui aidait les membres de Facebook à comprendre le classement d’une publication donnée.

Un post où un employé discute de la « responsabilité » de Facebook dans le développement d’algorithmes de classement.

Cliquez ici pour lire tous les papiers Facebook que nous avons publiés jusqu’à présent.

Source-143