Peu d’entreprises ont sans doute contribué involontairement à l’augmentation du bruit généré par l’IA en ligne autant qu’OpenAI. Malgré ses meilleures intentions – et en dépit de ses conditions de service – ses modèles de langage d’IA sont souvent utilisés pour composer du spam, et ses recherches pionnières ont inspiré d’autres à créer des modèles d’IA qui peuvent potentiellement faire la même chose. Cet afflux de contenu généré par l’IA a encore réduit l’efficacité des moteurs de recherche axés sur le référencement comme Google. En 2024, la recherche sur le Web est dans un état pitoyable.
Il est intéressant de constater qu’OpenAI propose désormais une solution potentielle à ce problème. Jeudi, OpenAI a dévoilé un prototype de moteur de recherche basé sur l’IA, appelé SearchGPT, qui vise à fournir aux utilisateurs des réponses rapides et précises provenant du Web. Il s’agit également d’un défi direct pour Google, qui a également essayé d’appliquer l’IA générative à la recherche sur le Web (mais avec peu de succès).
L’entreprise affirme qu’elle prévoit d’intégrer les aspects les plus utiles du prototype temporaire dans ChatGPT à l’avenir. ChatGPT (et Microsoft Copilot) peuvent déjà effectuer des recherches sur le Web à l’aide de Bing, mais SearchGPT semble être l’interface spécialement conçue par OpenAI pour la recherche sur le Web assistée par l’IA.
SearchGPT tente de simplifier le processus de recherche d’informations en ligne en combinant les modèles d’IA d’OpenAI (comme GPT-4o) avec des données Web en temps réel. Comme ChatGPT, les utilisateurs peuvent poser des questions de suivi à SearchGPT, le modèle d’IA conservant le contexte tout au long de la conversation.
Le plus important, du point de vue de la précision, est peut-être que le prototype SearchGPT (que nous n’avons pas testé nous-mêmes) comprendrait des fonctionnalités qui attribuent une place importante aux sources Web. Les réponses incluent des citations et des liens en ligne, tandis qu’une barre latérale affiche des liens sources supplémentaires.
OpenAI n’a pas encore précisé comment il obtenait ses données Web en temps réel et s’il s’associait à un fournisseur de moteur de recherche existant (comme il le fait actuellement avec Bing pour ChatGPT) ou s’il construisait son propre système d’exploration et d’indexation Web.
Un moyen de contourner le blocage d’OpenAI par les éditeurs
ChatGPT peut déjà effectuer des recherches sur le Web à l’aide de Bing, mais depuis août dernier, lorsqu’OpenAI a révélé un moyen de bloquer son robot d’exploration Web, cette fonctionnalité n’est plus aussi utile qu’elle aurait pu l’être. De nombreux sites, tels qu’Ars Technica (qui bloque le robot d’exploration OpenAI dans le cadre de la politique de notre société mère), n’apparaîtront pas dans les résultats de recherche dans ChatGPT à cause de cela.
SearchGPT semble démêler le lien entre le robot d’exploration Web d’OpenAI pour extraire les données d’entraînement et le désir des utilisateurs du chatbot OpenAI de rechercher sur le Web. Notamment, dans la nouvelle annonce SearchGPT, OpenAI déclare : « Les sites peuvent apparaître dans les résultats de recherche même s’ils choisissent de ne pas suivre l’entraînement génératif de l’IA. »
Cependant, OpenAI affirme travailler sur un moyen pour les éditeurs de gérer la manière dont ils apparaissent dans les résultats de SearchGPT afin que « les éditeurs aient plus de choix ». Et l’entreprise affirme que la capacité de SearchGPT à parcourir le Web est distincte de la formation des modèles d’IA d’OpenAI.
Un avenir incertain pour la recherche assistée par l’IA
OpenAI affirme que SearchGPT rendra les recherches sur le Web plus rapides et plus faciles. Cependant, l’efficacité de la recherche basée sur l’IA par rapport aux méthodes traditionnelles est inconnue, car la technologie en est encore à ses débuts. Mais soyons francs : le moteur de recherche Web le plus important à l’heure actuelle est assez mauvais.
Au cours de l’année écoulée, nous avons vu Perplexity.ai décoller en tant que remplacement potentiel de la recherche Google alimentée par l’IA, mais le service a été traqué par des problèmes de confabulations et d’accusations de plagiat parmi les éditeurs, y compris la société mère d’Ars Technica, Condé Nast.
Contrairement à Perplexity, OpenAI a conclu de nombreux accords de contenu avec des éditeurs et souligne qu’elle souhaite travailler en particulier avec les créateurs de contenu. « Nous nous engageons à créer un écosystème florissant d’éditeurs et de créateurs », déclare OpenAI dans son communiqué de presse. « Nous espérons aider les utilisateurs à découvrir les sites et les expériences des éditeurs, tout en offrant plus de choix en matière de recherche. »
Dans une déclaration pour le communiqué de presse d’OpenAI, Nicholas Thompson, PDG de The Atlantic (qui a un accord de contenu avec OpenAI), a exprimé son optimisme quant au potentiel de la recherche par IA : « La recherche par IA va devenir l’un des principaux moyens par lesquels les gens naviguent sur Internet, et il est crucial, à l’heure actuelle, que la technologie soit conçue de manière à valoriser, respecter et protéger le journalisme et les éditeurs », a-t-il déclaré. « Nous sommes impatients de nous associer à OpenAI dans ce processus et de créer une nouvelle façon pour les lecteurs de découvrir The Atlantic. »
OpenAI a expérimenté d’autres ramifications de sa technologie de modèle de langage IA qui n’ont pas connu de succès retentissants (les GPT me viennent notamment à l’esprit), donc le temps nous dira si les techniques derrière SearchGPT sont durables et si elles peuvent fournir des résultats précis sans hallucinations. Mais l’état actuel de la recherche sur le Web invite à de nouvelles expériences pour séparer le signal du bruit, et il semble qu’OpenAI se lance dans l’arène.
OpenAI déploie actuellement SearchGPT auprès d’un petit groupe d’utilisateurs et d’éditeurs pour les tester et recueillir leurs commentaires. Les personnes intéressées par l’essai du prototype peuvent s’inscrire sur une liste d’attente sur le site Web de l’entreprise.