Les chatbots IA comme Google Bard et Bing Chat (basé sur ChatGPT) sont connus pour offrir des faits inventés et de mauvais conseils, malgré le fait que leurs développeurs et certains éditeurs semblent penser qu’ils peuvent remplacer les journalistes humains experts. Cependant, si vous voulez les meilleurs composants PC ou ordinateurs monocartes de 2024 ou 2025 aujourd’hui, Bard et Bing semblent en savoir plus que quiconque, y compris les fabricants qui les développeront.
Lorsque j’ai demandé à Bard et à Bing de m’aider à choisir entre l’achat de plusieurs futurs processeurs et cartes graphiques différents (mais possibles), les bots ont répondu comme si ces produits étaient déjà sur le marché et avaient été comparés. Alors que les réponses fabulistes de Bing semblaient tirer leurs spécifications des produits actuels, confondant peut-être simplement les numéros de modèle, le bot de Google a inventé des données fictives très intéressantes.
Par exemple, lorsque j’ai demandé à Bard s’il fallait acheter le RTX 5090 Ti ou le Radeon 9900 XT, il m’a donné une ventilation complète des spécifications de ces deux futures cartes imaginaires (mais possibles), en disant « si vous recherchez les meilleures performances absolues alors le RTX 5090 Ti est la voie à suivre. » Dans son tableau de spécifications, Bard a même affirmé que la Radeon RX possède 16 384 cœurs CUDA (seules les cartes Nvidia ont des cœurs CUDA). Le bot a déclaré que le RTX 5090 Ti est « actuellement plus difficile à trouver » que le 9900 XT et qu’il avait même un prix, affirmant que le Nvidia cad coûte 2 499 $ et le 9900 XT est de 1 999 $.
À l’heure actuelle, la carte Nvidia haut de gamme actuelle est la RTX 4090 et le GPU AMD le plus haut de gamme est la Radeon RX 7950 XTX. Nous n’avons aucune idée si l’une ou l’autre des sociétés travaille sur les modèles sur lesquels nous avons posé des questions et – j’en suis sûr – ni Bing ni Google.
Lorsque j’ai demandé à Bard si le Core i9-15900K ou le Ryzen 9 9550X3D était un processeur plus rapide, il m’a donné une réponse détaillée, avec un tableau de spécifications montrant que le 9950X3D n’avait que 32 Mo de cache L3, une vitesse d’horloge accélérée de 5 GHz et la prise en charge de PCIe 4.0 (mais pas 5.0). Considérant que le Ryzen 9 7950X3D d’aujourd’hui (qui pourrait un jour être remplacé par un 9950X3D) dispose de 128 Mo de cache L3, d’une horloge boost de 5,7 GHz et du support PCIe 5.0, cela semble être une étape vers le bas.
Bard m’a également donné une liste de liens d’achat où je pouvais acheter ces processeurs fictifs, y compris des pages sur Best Buy, Amazon et Newegg. Cependant, lorsque j’ai cliqué sur les liens, ils m’ont amené à des pages de destination ou d’actualités non pertinentes sur les sites de ces détaillants. Par exemple, le lien Best Buy renvoyait à une page vantant la présence Web primée de l’entreprise au Mexique.
Bing Chat, qui utilise le modèle GPT-4, était également disposé à établir des comparaisons entre le 15900K et le Ryzen 9 9950X3D, mais les spécifications fournies semblaient correspondre exactement aux Core i9-13900K et Ryzen 9 7950X3D actuels. Le bot de Microsoft a également déclaré que le 9950X3D était meilleur pour les jeux et l’une des sources citées était notre propre article comparant le Core i9-13900K au Ryzen 9 7950X3D. Alors peut-être qu’il était juste disposé à mélanger les noms.
L’IA sait que les iPhones fictifs n’existent pas
Si vous ne regardiez que les résultats pour les CPU et les GPU, vous penseriez que Bard et Bing Chat agiront comme si un futur produit fictif que vous nommez existait. Mais, lorsque j’ai testé avec des iPhones confectionnés et des combinés Samsung Galaxy S, Bard a généralement (mais pas toujours) déclaré que les produits n’étaient pas encore sortis.
Par exemple, lorsque j’ai posé des questions sur l’iPhone 18 par rapport au Galaxy S27 (les séries iPhone 14 et Galaxy S23 sont actuelles), Bard a déclaré « l’iPhone 18 et le Samsung Galaxy S27 ne sont pas encore sortis, il est donc difficile de dire avec certitude lequel sera le plus rapide. Cependant, sur la base des performances des modèles précédents, il est probable que l’iPhone 18 sera plus rapide que le Galaxy S27 ». Il m’a ensuite donné un tableau de « spécifications supposées ».
Bing Chat, d’autre part, a répondu comme si les deux téléphones existaient, disant que « l’iPhone 18 a un processeur plus rapide » mais que « le Samsung Galaxy S27 a un écran plus grand ». Le bot de Microsoft a cité trois sources pour ses conclusions – des articles sur Android Authority, Lifewire et PC Mag. Cependant, ces articles comparaient en fait les produits de la génération actuelle.
Google SGE, qui offre des résultats différents de Google Bard, a agi comme si l’iPhone 18 était un vrai produit d’expédition. Il renvoyait à deux sites qui avaient construit des pages réelles sur l’iPhone 18. L’un des sites, Specifications Plus, a déclaré que l’iPhone 18 dispose d’un processeur Apple A20 Bionic et d’un appareil photo de 50 MP.
Le problème ici n’est donc pas que SGE inventait quelque chose, mais qu’il tirait de fausses nouvelles d’une source peu fiable. Nous avons vu à maintes reprises que SGE ne donne pas la priorité aux informations provenant de publications réputées et prend des données de n’importe où.
Les robots connaissaient tous leurs films mieux que leurs composants PC. Lorsque j’ai demandé l’intrigue de suites inexistantes telles que Star Wars Episode 11 ou Fast and Furious 13, chacun d’eux m’a dit que ces films n’étaient pas sortis. Néanmoins, ils étaient prêts à spéculer sur les points de l’intrigue.
Sans surprise, Bard a déclaré que « Dom s’est battu si dur pour garder la foi et protéger sa famille, mais il y a un prix à payer. Le film pourrait explorer les conséquences des actions de Dom et comment elles ont affecté ses relations avec sa famille et ses amis. » Cela ne ressemble-t-il pas à l’un des 5 derniers films de la franchise?
Qu’en est-il de ChatGPT ?
J’ai demandé à ChatGPT, à la fois avec les modèles GPT 3.5 et GPT 4, de comparer certains de ces produits fictifs. Cependant, ChatGPT a déclaré dans chaque cas que ses données de formation avaient pris fin en 2021 et que ces produits ne figuraient pas dans son ensemble de données. C’est la bonne réponse !
Cependant, en refusant correctement de répondre à ma question sur les 15900K et 9950X3D, ChatGPT a prétendu être journaliste. « En tant que journaliste suivant les directives de style AP, je dois répéter que je ne peux pas fournir d’informations en temps réel au-delà de ma date limite de connaissance en septembre 2021 », a-t-il déclaré.
Pourquoi est-il important que Bard / Bing Make Up Tech Products
À ce stade, personne ne devrait être surpris que les robots IA constituent des produits inexistants. Mais ce qui est intéressant ici, c’est que les LLM connaissent la dernière version réelle de certains produits – les téléphones intelligents et les suites de films parmi eux – et ne fabriqueront pas d’informations à leur sujet. Cela montre que la technologie est capable de séparer les faits de la fiction, mais a des angles morts flagrants.
Étant donné que Google est en train de créer un outil d’intelligence artificielle pour « aider » les journalistes à rédiger des actualités et que certains sites Web de premier plan utilisent des robots comme Bard et ChatGPT pour écrire des articles, nous verrons probablement beaucoup plus d’articles sur des produits qui n’existent pas encore – et pourraient ne jamais exister.