vendredi, décembre 27, 2024

Autorisez le scraping IA de Google ou perdez la visibilité de la recherche

Alors que le gouvernement américain évalue ses options suite à une décision historique contre Google la semaine dernière, les publications en ligne sont de plus en plus confrontées à un avenir sombre. (Et cette fois, ce n’est pas seulement à cause de revenus publicitaires sévèrement réduits.) Bloomberg rapporte que leur choix se résume désormais à autoriser Google à utiliser leur contenu publié pour produire des « réponses » de recherche générées par l’IA en ligne ou à perdre leur visibilité dans le moteur de recherche de l’entreprise.

Le cœur du problème réside dans le robot d’indexation Googlebot, qui parcourt et indexe le Web en direct pour produire les résultats que vous voyez lorsque vous saisissez des termes de recherche. Si les éditeurs empêchent Google d’utiliser leur contenu pour les réponses produites par l’IA que vous voyez maintenant en haut de nombreux résultats de recherche, ils perdent également le privilège d’inclure leurs pages Web dans les résultats Web standard.

Le piège tendu a conduit les publications, les moteurs de recherche concurrents et les startups d’IA à placer leurs espoirs sur le ministère de la Justice. Mardi, Le New York Times Le ministère de la Justice envisagerait de demander à un juge fédéral de scinder certaines parties de l’entreprise (en scindant des sections comme Chrome ou Android). Il envisagerait également d’obliger Google à partager les données de recherche avec ses concurrents ou de renoncer à ses contrats de moteurs de recherche par défaut, comme celui de 18 milliards de dollars qu’il a signé avec Apple.

Google utilise un robot d’exploration distinct pour son chatbot Gemini (anciennement Bard). Mais son robot d’exploration principal couvre à la fois les aperçus AI et les recherches standard, ce qui laisse peu (voire aucun) pouvoir de décision aux éditeurs Web. Si vous laissez Google extraire votre contenu pour obtenir des réponses AI Overview, les lecteurs peuvent considérer que l’affaire est terminée sans prendre la peine de visiter votre site (ce qui signifie zéro revenu de ces lecteurs potentiels). Mais si vous bloquez le Googlebot, vous perdez la visibilité de recherche, ce qui signifie probablement beaucoup moins de revenus à court terme et une perte colossale de position concurrentielle à long terme.

iFixit Le PDG Kyle Wiens a déclaré Bloomberg« Je peux bloquer ClaudeBot [Anthropic’s crawler for its Claude chatbot] de nous indexer sans nuire à notre activité. Mais si je bloque Googlebot, nous perdons du trafic et des clients.

Un exemple de requête de recherche Google avec une réponse d'aperçu de l'IA.

Google

L’autre problème de la combinaison des deux est que Google bénéficie d’un avantage incommensurable sur les petites start-ups spécialisées dans l’IA. L’entreprise obtient une pléthore de données de formation gratuites de la part d’éditeurs désireux de rester visibles dans les moteurs de recherche. En revanche, les entreprises d’IA sont obligées de payer les éditeurs pour avoir accès à leurs données – et même dans ce cas, cela ne suffirait pas à combler le manque à gagner que Google obtient (essentiellement) gratuitement.

De ce point de vue, il n’est pas surprenant de lire que, selon BloombergGoogle rejette les éditeurs qui tentent de négocier des accords de contenu. (Reddit est la seule exception.) Pourquoi gaspiller de l’argent dans des accords de contenu alors qu’ils obtiennent toutes les données de formation qu’ils souhaitent en échange des résultats de recherche dont la plupart des éditeurs ont besoin pour survivre ?

« Vous avez maintenant un tas d’entreprises technologiques qui paient pour du contenu, elles paient pour y accéder parce qu’elles en ont besoin pour pouvoir être compétitives de manière sérieuse », a déclaré Alex Rosenberg, PDG de la start-up d’IA Tako Inc. Bloomberg« Alors que Google n’a pas vraiment besoin de faire ça. »

Tout est une question d’influence, que Google exerce sur les éditeurs désespérés. En plus des difficultés financières actuelles du secteur (les revenus publicitaires en ligne ont chuté de façon spectaculaire au cours des huit dernières années), Semaine de la publicité Il a été rapporté en mars que les réponses de recherche générées par l’IA de Google pourraient entraîner une baisse de 20 à 60 % du trafic de recherche organique.

La balle est désormais dans le camp du ministère de la Justice pour déterminer la direction que prendront Google – et, dans une certaine mesure, l’ensemble du Web – à partir de maintenant. BloombergL’histoire complète de mérite d’être lue.

Source-145

- Advertisement -

Latest