Le tribunal se prononce en faveur d’un web scraper, Bright Data, que Meta avait utilisé puis poursuivi en justice

Meta a perdu un procès dans sa bataille juridique avec la société technologique israélienne Bright Data, qu’elle avait poursuivie l’année dernière pour avoir récupéré des données de Facebook et d’Instagram via le Web. Le géant de la technologie, qui poursuit depuis longtemps les entreprises de récupération de données, a affirmé que la collecte de données par Bright Data constituait une violation de ses conditions de service – ce que Bright Data avait accepté en ayant des comptes sur les plateformes de Meta. Cependant, un tribunal a statué en faveur de Bright Data concernant la plainte pour « rupture de contrat » de Meta, affirmant que Meta n’avait pas présenté de preuves suffisantes démontrant que l’entreprise avait récupéré autre chose que des données publiques.

Le procès était particulièrement intéressant car il révélait que Meta avait auparavant payé Bright Data pour collecter des données sur des sites Web de commerce électronique afin de créer des profils de marque sur ses plateformes. En d’autres termes, Meta était client des services de web-scraping de Bright Data avant de les poursuivre en justice, même si elle utilisait les services de l’entreprise à des fins différentes. Dans une affaire connexe, Bright Data avait également été accusé d’avoir collecté des informations personnelles sur des mineurs extraites de Facebook et d’Instagram, a rapporté Bloomberg l’année dernière.

Le tribunal a déclaré qu’il avait rejeté la requête de Meta pour un jugement sommaire partiel sur la réclamation pour rupture de contrat parce que la société n’avait pas présenté suffisamment de preuves que Bright Data avait récupéré des données non publiques, c’est-à-dire des données qui ne se trouvent pas derrière un écran de connexion ou qui sont protégées par un mot de passe. . Au lieu de cela, ce que Meta a présenté au tribunal était un exemple d’un ensemble de données Bright Data proposé à la vente, qui comprenait 615 millions d’enregistrements de données utilisateur d’Instagram. L’ensemble de données se vend 860 000 $. Meta a affirmé que Bright Data avait collecté et vendu de « vastes » quantités de données utilisateur comme cet ensemble de données, qui comprenait des champs tels que les noms des utilisateurs d’Instagram, leur identifiant, leur pays, le nombre de publications, leur biographie, les hashtags, les abonnés, les publications, les images de profil, la catégorie d’entreprise. , e-mail et bien plus encore. Cependant, Meta n’a pas réussi à établir que ces données ne pouvaient être collectées que si Bright Data avait été connecté à un compte utilisateur.

Dans un autre exemple de l’activité de Bright Data, Meta a tenté de montrer que l’entreprise était en possession d’informations non publiques, mais le tribunal a décidé que cela ne prouvait pas le grattage de connexion, car les données auraient pu être accessibles au public plus tôt : comme avant qu’un utilisateur modifie ses paramètres de confidentialité, par exemple.

En outre, Meta a fait valoir que Bright Data avait utilisé des outils pour contourner ses restrictions d’accès, comme les CAPTCHA, ce qui prouvait que Bright Data collectait des données « derrière les barrières d’authentification ».

Le tribunal n’est pas non plus d’accord avec cela, affirmant que l’utilisation d’un programme automatisé pour contourner un CAPTCHA « est différent de l’accès à un site Web protégé par mot de passe » et que « Meta comprend sûrement la différence ».

Même si l’équipe d’enquête anti-scraping de Meta a découvert que Bright Data avait annoncé un « navigateur de scraping » qui automatiserait la connexion à un ordinateur blanc et simulerait d’autres actions de l’utilisateur pour faciliter la collecte automatisée de données, le tribunal a déclaré que cela ne constituait pas non plus une preuve suffisante que Bright Data avait effectué un scraping de connexion dans ce cas.

Le tribunal a également statué que les termes Facebook et Instagram devaient être considérés séparément et qu’il n’y avait aucune preuve que Bright Data avait utilisé ses propres comptes Facebook et Instagram lorsqu’elle s’était engagée dans le grattage de données. Cela signifie que Bright Data n’agissait pas en tant qu’« utilisateur » des services au moment du scraping, mais uniquement en tant que « visiteur » déconnecté. Le tribunal n’a pas non plus trouvé les autres arguments juridiques utilisés par Meta suffisamment convaincants pour se prononcer en sa faveur sur la rupture de contrat.

« Nous sommes impatients de poursuivre nos efforts pour protéger les données des utilisateurs et évaluons les prochaines étapes du litige en cours », a déclaré un porte-parole de Meta à TechCrunch à la lumière de la décision.

Le géant de la technologie poursuit régulièrement les entreprises qui se livrent à des opérations de grattage de données dans le but de décourager cette pratique. En octobre 2022, il a réglé une affaire contre deux autres sociétés, BrandTotal Ltd., basée en Israël, et Unimania Inc., société constituée dans le Delaware, qui ont toutes deux accepté une injonction permanente leur interdisant de récupérer les données de Facebook et d’Instagram à l’avenir et de payer à Meta un « somme financière importante », avait déclaré Meta.

L’entreprise s’était également entendue en 2020 avec le service de scraping Massroot8 et en 2022, elle a poursuivi en justice un opérateur de site de clonage et une société appelée Octopus, filiale américaine d’une entreprise nationale chinoise de haute technologie qui avait proposé des services de scraping. Meta a gagné ce procès, le tribunal ayant émis une injonction permanente pour mettre fin aux opérations de grattage de données de l’entreprise. L’année dernière, Meta a poursuivi une autre entreprise de grattage pour compte d’autrui, Voyager Labs, qui n’a pas encore été réglée.

De telles opérations de grattage de données peuvent mettre en danger la vie privée des utilisateurs, car les données collectées par les web scrapers ont déjà été divulguées en ligne, comme dans le cas où les données personnelles de 533 millions de comptes Facebook ont ​​été divulguées.

L’affaire actuelle avec Bright Data porte le numéro 3:23-cv-00077-EMC devant le tribunal de district américain de Californie du Nord.

La seule réclamation restante contre Bright Data dans cette affaire concerne une interférence délictuelle avec le contrat.

Bright Data a partagé le commentaire suivant du PDG Or Lenchner (c’est moi qui souligne) :

Lorsque Meta nous a approchés pour nous demander de cesser d’autoriser nos clients à collecter des données publiques (scraping) de Facebook et Instagram, nous avons décidé que la bonne chose à faire était de refuser et de résoudre ce problème devant les tribunaux parce que les données publiques doivent rester publiques. Malgré les nombreux efforts déployés par les géants de la technologie pour contrôler exclusivement les informations publiques sur Internet, le bon sens a prévalu. L’information publique est publique. Cela a toujours été notre revendication et nous sommes très heureux de la décision du tribunal qui soutient cette approche. Bright Data, en tant que principale société de collecte de données sur le Web, continuera à lutter pour le droit fondamental au libre accès aux informations publiques sur le Web..

Mis à jour le 24/01/24, 11 h 22 HE avec commentaire Meta, 16 h 39 HE avec commentaire Bright Data.

Source-146