La consternation et le mépris ont envahi les réseaux sociaux des scientifiques jeudi alors que plusieurs chiffres extrêmement mauvais générés par l’IA circulaient à partir d’un article évalué par des pairs récemment publié dans une revue réputée. Ces chiffres – dont les auteurs reconnaissent dans le texte de l’article qu’ils proviennent de Midjourney – sont tous ininterprétables. Ils contiennent du texte charabia et, le plus frappant, l’un d’eux inclut l’image d’un rat avec des organes génitaux grotesquement grands et bizarres, ainsi qu’une étiquette de texte « dck ».
Jeudi, l’éditeur de l’article de synthèse, Frontiers, a publié une « expression d’inquiétude », indiquant qu’il était conscient des inquiétudes concernant l’article publié. « Une enquête est actuellement en cours et cet avis sera mis à jour en conséquence une fois l’enquête terminée », a écrit l’éditeur.
L’article en question s’intitule « Fonctions cellulaires des cellules souches spermatogoniales en relation avec la voie de signalisation JAK/STAT », rédigé par trois chercheurs chinois, dont l’auteur correspondant Dingjun Hao de l’hôpital Xi’an Honghui. Il a été publié en ligne mardi dans la revue Frontiers in Cell and Developmental Biology.
Frontiers n’a pas immédiatement répondu à la demande de commentaires d’Ars, mais nous mettrons à jour ce message avec toute réponse.
Le premier personnage du document, celui contenant le rat, a immédiatement attiré l’attention alors que les scientifiques ont commencé à le partager largement et à le commenter sur les plateformes de médias sociaux, notamment Bluesky et X, l’ancienne plateforme connue sous le nom de Twitter. De loin, l’image anatomique est clairement fausse de toutes sortes. Mais en y regardant de plus près, on ne fait que révéler d’autres défauts, notamment les étiquettes « dissilées », cellules souches, « iollotte sserotgomar » et « dck ». De nombreux chercheurs ont exprimé leur surprise et leur consternation qu’une image aussi manifestement mauvaise générée par l’IA puisse passer à travers le pair. -système de révision et tout traitement interne en place au sein de la revue.
Mais le paquet du rat est loin d’être le seul problème. La figure 2 est moins graphique mais tout aussi mutilée. Bien qu’il soit censé être un diagramme d’une voie de signalisation complexe, il s’agit plutôt d’un désordre confus. Un expert en intégrité scientifique s’est demandé si le texte fournissait une explication trop compliquée sur « comment faire un beignet avec des pépites colorées ». Comme la première image, le diagramme regorge de textes absurdes et d’images déroutantes. La figure 3 n’est pas meilleure, offrant un collage de petites images circulaires densément annotées de charabia. L’image est censée fournir des représentations visuelles de la manière dont la voie de signalisation de la figure 2 régule les propriétés biologiques des cellules souches spermatogoniales.
Certains scientifiques en ligne se sont demandé si le texte de l’article était également généré par l’IA. Un utilisateur a noté que le logiciel de détection de l’IA avait déterminé qu’il était probable qu’elle soit générée par l’IA ; cependant, comme Ars l’a signalé précédemment, un tel logiciel n’est pas fiable.
Les images, bien qu’elles soient des exemples flagrants, mettent en évidence un problème croissant dans la publication scientifique. Le succès d’un scientifique dépend en grande partie de ses publications, avec un grand volume de publications, des publications fréquentes et des articles parus dans des revues de premier plan, qui confèrent tous plus de prestige aux scientifiques. Le système incite les chercheurs peu scrupuleux à publier des articles de mauvaise qualité qui, à l’ère des chatbots IA, pourraient potentiellement être générés avec l’aide de l’IA. Les chercheurs craignent que l’utilisation croissante de l’IA ne rende les recherches publiées moins fiables. C’est pourquoi les revues de recherche ont récemment établi de nouvelles lignes directrices en matière de paternité pour les textes générés par l’IA afin de tenter de résoudre le problème. Mais pour l’instant, comme le montre l’article de Frontiers, il existe clairement des lacunes.