Google confirme que les documents de recherche divulgués sont réels

Une collection de 2 500 documents internes divulgués par Google, remplis de détails sur les données collectées par l’entreprise, est authentique, a confirmé l’entreprise aujourd’hui. Jusqu’à présent, Google avait refusé de commenter ces documents.

Les documents en question détaillent les données dont Google assure le suivi, dont certaines peuvent être utilisées dans son algorithme de classement de recherche étroitement surveillé. Les documents offrent un aperçu sans précédent – ​​quoique encore obscur – des dessous de l’un des systèmes les plus conséquents qui façonnent le Web.

« Nous vous déconseillons de formuler des hypothèses inexactes sur la recherche basée sur des informations hors contexte, obsolètes ou incomplètes », a déclaré le porte-parole de Google, Davis Thompson. Le bord dans un e-mail. « Nous avons partagé de nombreuses informations sur le fonctionnement de la recherche et les types de facteurs pris en compte par nos systèmes, tout en nous efforçant de protéger l’intégrité de nos résultats contre toute manipulation. »

L’existence du matériel divulgué a été soulignée pour la première fois par des experts en optimisation des moteurs de recherche (SEO). Rand Fishkin et Mike Roi, qui ont chacun publié en début de semaine de premières analyses des documents et de leur contenu. Google n’a pas répondu Le bordHier, nous avons reçu plusieurs demandes de commentaires sur l’authenticité de la fuite.

La fuite est susceptible de provoquer des répercussions dans l’industrie du référencement.

Les documents divulgués suggèrent que Google collecte et utilise potentiellement des données qui, selon les représentants de l’entreprise, ne contribuent pas au classement des pages Web dans la recherche Google, comme les clics, les données des utilisateurs de Chrome, etc. Les milliers de pages de documents servent de référentiel d’informations pour les employés de Google, mais il n’est pas clair quelles données détaillées sont réellement utilisées pour classer le contenu de recherche – les informations pourraient être obsolètes, utilisées uniquement à des fins de formation ou collectées, mais non utilisé spécifiquement pour la recherche. Les documents ne révèlent pas non plus comment les différents éléments sont pondérés dans la recherche, voire pas du tout.

Néanmoins, les informations rendues publiques sont susceptibles de provoquer des répercussions dans les secteurs de l’optimisation des moteurs de recherche (SEO), du marketing et de l’édition. Google est généralement très secret sur le fonctionnement de son algorithme de recherche, mais ces documents – ainsi que les récents témoignages dans l’affaire antitrust du ministère américain de la Justice – ont apporté plus de clarté sur les signaux auxquels Google pense lorsqu’il s’agit de classer des sites Web.

Les choix que Google fait en matière de recherche ont un impact profond sur toute personne qui utilise le Web pour ses affaires, des petits éditeurs indépendants aux restaurants en passant par les boutiques en ligne. À son tour, une industrie de personnes espérant déchiffrer le code ou déjouer l’algorithme est apparue, fournissant des réponses parfois contradictoires. Le flou et le hachage des mots de Google n’ont pas aidé, mais l’afflux de documents internes offre au moins une idée de ce que pense l’entreprise qui domine le Web.

source site-132