Google a apporté une modification à sa politique de confidentialité qui clarifie l’étendue de ses ambitions croissantes en matière d’IA. Essentiellement, le géant de la recherche affirme que tout ce qui est publié publiquement en ligne est un jeu équitable à gratter et à utiliser pour améliorer les outils d’IA comme son rival ChatGPT, Google Bard.
Repérée pour la première fois par Gizmodo, la société a mis à jour sa politique au cours du week-end pour indiquer qu’elle utilisera « des informations accessibles au public pour aider à former les modèles d’IA de Google et à créer des produits et des fonctionnalités telles que les capacités de Google Translate, Bard et Cloud AI ».
Il s’agit d’un changement notable par rapport au libellé de la politique précédente qui indiquait que Google utilisait simplement les informations pour créer des « modèles linguistiques » pour Google Translate. Le chatbot Bard de l’entreprise et le terme nébuleux « Cloud AI » sont désormais également inclus.
Qu’est-ce que cela signifie? Eh bien, les utilisateurs peuvent supposer en toute confiance que tout ce qui est publié à l’aide d’un produit Google (Search, Gmail, YouTube) sera enregistré et utilisé par l’entreprise d’une manière ou d’une autre. Mais cela va plus loin. Le libellé indique que Google utilisera informations accessibles au public pour former son IA qui pourrait être lue comme essentiellement tout ce qui est publié sur Internet en général. Considérant que la plate-forme de recherche conquérante de Google a été construite sur PageRank et sa capacité à indexer efficacement le Web, cette décision de l’IA a d’énormes ramifications.
Tom’s Guide a contacté Google pour plus de précisions sur ce que cela signifie et nous mettrons à jour cet article si et quand nous recevons une réponse.
Google a révélé un certain nombre de nouveaux projets d’IA lors de sa conférence annuelle I/O plus tôt dans l’année, y compris le fait que l’ensemble de son portefeuille Workspace l’utiliserait. Mais le point de friction pour de nombreuses organisations est de savoir où et comment les grands modèles linguistiques (LLM) qui alimentent ces projets obtiennent leurs informations.
Google a été contraint de suspendre le déploiement de son chatbot Bard en Europe pendant que l’UE envisage d’imposer une réglementation sur les produits d’IA. Pendant ce temps, des plates-formes telles que Reddit et Twitter ont désactivé l’accès gratuit à leurs API, ce qui a permis à d’autres de télécharger d’importants arriérés de messages et potentiellement de récolter le contenu pour former l’IA.
ChatGPT, le principal rival de Google dans le domaine de l’IA à l’heure actuelle, a été contraint d’introduire des contrôles de données pour les utilisateurs du monde entier après une plainte des autorités italiennes de protection des données. Les utilisateurs peuvent désormais lui demander de ne pas s’entraîner sur les données que nous lui fournissons.
Mais c’est une bête différente que d’ouvrir l’intégralité du Web public à l’exploration potentielle de l’une des plus grandes entreprises technologiques de la planète. Alors que la plupart des internautes devraient comprendre la différence entre l’Internet public et privé, il reste à voir ce qu’ils ressentiront à l’idée que tout message public publié à un moment donné se transforme soudainement en fourrage pour l’empire naissant de l’IA de Google.