Google ne sauvegardera plus Internet : les pages Web mises en cache sont mortes

Google ne conservera plus de sauvegarde de l’intégralité d’Internet. Les liens « mis en cache » de la recherche Google ont longtemps été un moyen alternatif de charger un site Web en panne ou modifié, mais maintenant l’entreprise les tue. Google « Search Liaison » Danny Sullivan a confirmé la suppression de la fonctionnalité dans un Message Xaffirmant que la fonctionnalité « était destinée à aider les gens à accéder aux pages lorsqu’il y a longtemps, on ne pouvait souvent pas compter sur le chargement d’une page. De nos jours, les choses se sont grandement améliorées. Il a donc été décidé de la retirer. »

La fonctionnalité apparaît et disparaît pour certaines personnes depuis décembre, et actuellement, nous ne voyons aucun lien de cache dans la recherche Google. Pour l’instant, vous pouvez toujours créer vos propres liens de cache même sans le bouton, simplement en accédant à « https://webcache.googleusercontent.com/search?q=cache: » plus l’URL d’un site Web, ou en tapant « cache: ». plus une URL dans la recherche Google. Pour l’instant, la version mise en cache d’Ars Technica semble toujours fonctionner. Toutes les pages d’assistance de Google concernant les sites mis en cache ont été supprimées.

Les liens mis en cache se trouvaient sous le menu déroulant à côté de chaque résultat de recherche sur la page Google. Alors que le robot d’exploration de Google parcourait Internet à la recherche de pages Web nouvelles et mises à jour, il enregistrait également une copie de tout ce qu’il voyait. Cela a rapidement conduit Google à effectuer une sauvegarde de la quasi-totalité d’Internet, en utilisant probablement un nombre incalculable de pétaoctets de données. Google est désormais à l’ère des économies de coûts, donc en supposant que Google puisse simplement commencer à supprimer les données du cache, cela peut probablement libérer beaucoup de ressources.

Les liens mis en cache étaient très utiles si le site Web était en panne ou modifié rapidement, mais ils donnaient également un aperçu au fil des années de la façon dont le robot d’exploration Web « Google Bot » percevait le Web. Les pages ne sont pas nécessairement rendues comme on pourrait s’y attendre. Dans le passé, les pages étaient uniquement composées de texte, mais peu à peu, le Google Bot a découvert les médias et d’autres données riches comme le javascript (il existe désormais une tonne de Google Bots spécialisés). De nombreux détails de Google Bot sont entourés de secret pour se cacher des spammeurs SEO, mais vous pourriez en apprendre beaucoup en étudiant à quoi ressemblent les pages mises en cache. En 2020, Google est passé au mobile par défaut, donc par exemple, si vous visitez ce lien Ars mis en cache plus tôt, vous obtenez le site mobile. Si vous gérez un site Web et souhaitez en savoir plus sur ce à quoi ressemble un site pour un Google Bot, vous pouvez toujours le faire, mais uniquement pour votre propre site, à partir de la Search Console.

La disparition des sites mis en cache signifiera qu’Internet Archive aura une plus grande charge d’archivage et de suivi des modifications sur les pages Web du monde.

Source-147