Comme TechRadar Pro signalé plus tôt en janvier 2023, un ancien Yandex employé avec un motif «politique» aurait divulgué un vaste référentiel de code source pour de nombreux produits du portail Web, mettant potentiellement en lumière l’art sombre de optimisation du moteur de recherche.
BipOrdinateur (s’ouvre dans un nouvel onglet) rapporte que l’employé a divulgué des sources git totalisant 44,7 Go de fichiers, contenant « tout » le code source de Yandex à l’exception de ses règles anti-spam, qui ont été obtenues en juillet 2022.
Le code source brut n’intéressera pas tout le monde, Pays des moteurs de recherche (s’ouvre dans un nouvel onglet)Le rapport selon lequel 17 854 facteurs de classement de recherche ont été découverts dans le cadre de la fuite devrait intéresser toute personne, entreprise ou publication cherchant à voir ses pages bien classées dans les moteurs de recherche.
Yandex fuit les informations SEO
UN liste partielle des facteurs classés par le moteur de recherche Yandex à partir d’un fichier de la base de code, partagé par le PDG du cabinet de conseil SEO MOG Media Martin MacDonald, met en lumière les aspects de la copie auxquels Yandex applique du poids.
Par Nouvelles de la recherche russe (s’ouvre dans un nouvel onglet)ceux-ci incluent le PageRank et plusieurs aspects des liens tels que l’âge et la pertinence, la pertinence perçue de la copie, la fiabilité de l’hôte et les préférences innées envers des sites spécifiques avec une autorité perçue, comme Wikipedia.
Une plongée plus profonde, plus longue et plus technique par Pays des moteurs de recherche (s’ouvre dans un nouvel onglet) montre également que cette priorité inclut également un « NEWS_AGENCY_RATING », permettant au moteur de recherche de Yandex de montrer la préférence à certaines organisations de presse.
D’autres incluent le nombre de visiteurs uniques, les pourcentages de trafic organique et le classement moyen des domaines dans les requêtes.
Cependant, il est peut-être mélodramatique, ou un peu désolé, pour MacDonald de le décrire comme « la chose la plus intéressante qui se soit produite dans le référencement depuis des années ».
Bien que la base de code divulguée offre certainement une multitude d’informations, il convient de noter que de nombreux sites Web chercheront à bien se classer sur Google par rapport à Yandex, uniquement parce que le premier est beaucoup plus connu.
Les deux sociétés ont partagé des ingénieurs Web au fil des ans, Yandex utilise de nombreuses technologies open source de Google, telles que TensorFlow et BERT, et des références aux données de Google apparaissent dans la base de code divulguée.
Cependant, la plongée en profondeur de Search Engine Land soutient que la fuite de Yandex peut donner un aperçu général de l’anatomie d’un moteur de recherche moderne, mais, selon Russian Search News, de nombreux facteurs de recherche de classement divulgués par Yandex ne sont pas utilisés ou sont officiellement considérés comme dépréciés.
Même la plongée technique approfondie admet que de nombreux aspects connus de Google (le moteur de recherche), tels que ses systèmes d’exploration et d’indexation, diffèrent de Yandex.
Tout cela, combiné à l’âge de la base de code divulguée, ne permet pas de savoir clairement comment les hypothèses sur la manière dont Yandex et Google peuvent classer les pages se comporteront.