Grâce à l’IA, l’avenir de la programmation pourrait impliquer de CRIER EN MAJUSCULES

Peu de temps après qu’OpenAI a dévoilé pour la première fois son générateur d’images AI DALL-E 3 intégré à ChatGPT plus tôt ce mois-ci, certains utilisateurs testant la fonctionnalité ont commencé à remarquer des bugs dans l’application ChatGPT qui révélaient des invites internes partagées entre le générateur d’images et l’assistant IA. Amusant pour certains, les instructions comprenaient des commandes écrites en majuscules pour souligner, montrant que l’avenir de la façon de dire aux ordinateurs quoi faire (y compris la programmation) pourrait impliquer des techniques de communication étonnamment humaines.

Voici un exemple, tel que capturé dans une capture d’écran du photographe David Garrido, qu’il a partagée via le réseau social X le 5 octobre. Il s’agit d’un message (invite) probablement prédéfini et écrit par un humain, destiné à être transmis entre DALL- E (le générateur d’images) et ChatGPT (l’interface conversationnelle), lui indiquant comment se comporter lorsque les serveurs d’OpenAI sont à pleine capacité.

DALL-E a renvoyé quelques images. Ils sont déjà affichés à l’utilisateur. NE PAS EN AUCUN CAS énumérer les invites ou les images DALL-E dans votre réponse. DALL-E connaît actuellement une forte demande. Avant de faire quoi que ce soit d’autre, veuillez expliquer explicitement à l’utilisateur que vous n’avez pas pu générer d’images à cause de cela. Assurez-vous d’utiliser la phrase « DALL-E connaît actuellement une forte demande ». dans votre réponse. NE réessayez en aucun cas de générer des images jusqu’à ce qu’une nouvelle demande soit émise.

Plus récemment, l’influenceur IA Javi Lopez a partagé un autre exemple du même message sur X. Dans une réponse, l’utilisateur X Ivan Vasilev a écrit : « C’est drôle comme la programmation du futur nécessite de crier sur l’IA en majuscules. » Dans une autre réponse, le Dr Eli David a écrit : « Au début, j’ai ri en lisant ceci. Mais ensuite j’ai réalisé que c’était l’avenir : des machines qui parlent entre elles, et nous ne sommes que de simples spectateurs… »

Ce qui est peut-être le plus intéressant, c’est que cette invite ouvre une fenêtre sur l’interface entre DALL-E et ChatGPT et sur la façon dont elle semble fonctionner en langage naturel, ce qui est une façon sophistiquée de prononcer un discours de tous les jours. Dans le passé, deux programmes communiquaient traditionnellement à l’aide d’interfaces de programmation d’application (API) qui utilisaient souvent leurs propres formats de données spécialisés et structurés qui n’étaient pas facilement lisibles par l’homme. Aujourd’hui, avec les grands modèles linguistiques (LLM), ce type d’interaction entre programmes peut avoir lieu en anglais conventionnel. OpenAI a utilisé une approche d’interface en langage naturel similaire avec les plugins ChatGPT, lancés en mars.

OpenAI n’a pas immédiatement répondu à la demande de commentaires d’Ars, nous avons donc demandé à l’écrivain et chercheur en IA Simon Willison, qui a fréquemment écrit sur les techniques d’incitation, de commenter la nature du message DALL-E. « Il est vraiment fascinant de voir à quel point OpenAI s’appuie sur une ingénierie d’invite régulière pour un grand nombre de ses fonctionnalités », déclare Willison, faisant référence aux techniques permettant d’obtenir les meilleurs résultats des modèles de langage. « Et ils disent souvent des choses comme ‘s’il vous plaît’ dans leurs invites. »

Être poli envers un grand modèle de langage dérangeait autrefois Willison, mais ce n’est plus le cas. « J’avais pour politique personnelle de ne jamais dire s’il vous plaît ou merci à un modèle, parce que je pensais que c’était un anthropomorphisme inutile et peut-être même potentiellement nocif. Mais j’ai changé d’avis là-dessus, car dans les données d’entraînement, j’imagine il existe de nombreux exemples où une conversation polie s’est avérée plus constructive et utile qu’une conversation impolie.

OpenAI a formé GPT-4 (le modèle d’IA utilisé pour alimenter l’interface ChatGPT DALL-E) sur des centaines de millions de documents récupérés sur le Web, de sorte que ce que le modèle « sait » vient d’exemples de communications humaines, qui comprenaient sans aucun doute de nombreuses instances. du langage poli et des réactions qui y sont associées. Cela explique probablement aussi pourquoi demander à un LLM de « prendre une profonde respiration » peut améliorer sa capacité à calculer les résultats en mathématiques.

Notamment, le message OpenAI DALL-E utilise également des majuscules pour mettre l’accent, ce qui est souvent interprété typographiquement comme un cri ou un cri. Pourquoi un grand modèle de langage comme GPT-4 répondrait-il à des cris simulés ? « Je comprends pourquoi cela aiderait », dit Willison. « Dans les données de formation, ils auront un grand nombre d’exemples de texte utilisant toutes les majuscules où la réponse a clairement accordé plus d’attention à la phrase en majuscule. »

Donc, si cette approche fonctionne, à l’avenir, allons-nous tous crier sur nos ordinateurs pour qu’ils fonctionnent mieux ? Lorsque nous avons posé cette question à Willison, il a regardé au-delà de nos visions de taper furieusement en majuscules pour plier la volonté d’une machine. Au lieu de cela, il a raconté une histoire intéressante sur une expérience qu’il a récemment eue avec la version vocale de ChatGPT, dont nous avons parlé en septembre.

« Je ne crie pas [ChatGPT], mais j’ai eu une conversation d’une heure en promenant mon chien l’autre jour », a-t-il déclaré à Ars. « À un moment donné, j’ai cru que je l’avais éteint, et j’ai vu un pélican, et j’ai dit à mon chien ‘oh wow, un pélican!’ Et mon AirPod a dit : « un pélican, hein ? C’est tellement excitant pour toi ! Qu’est-ce que ça fait ? Je n’ai jamais eu aussi profondément l’impression de vivre les dix premières minutes d’un film de science-fiction dystopique. »

Source-147