OpenAI vient de sortir GPT-4, une IA générative multimodale

Dans la foulée de l’annonce de Google Workspace AI mardi, et avant l’événement Microsoft Future of Work de jeudi, OpenAI a publié la dernière itération de son système de transformateur pré-formé génératif, GPT-4. Alors que la génération actuelle GPT-3.5, qui alimente le très populaire bot conversationnel ChatGPT d’OpenAI, ne peut lire et répondre qu’avec du texte, le nouveau GPT-4 amélioré pourra également générer du texte sur les images d’entrée. « Bien que moins capable que les humains dans de nombreux scénarios du monde réel », a écrit l’équipe OpenAI mardi, il « présente des performances de niveau humain sur divers critères professionnels et académiques ».

OpenAI, qui s’est associé (et a récemment renouvelé ses vœux) à Microsoft pour développer les capacités de GPT, aurait passé les six derniers mois à réajuster et à affiner les performances du système en fonction des commentaires des utilisateurs générés par le récent hoopla ChatGPT. la société rapporte que GPT-4 a réussi des examens simulés (tels que l’Uniform Bar, le LSAT, le GRE et divers tests AP) avec un score « autour des 10 % des meilleurs candidats » par rapport à GPT-3.5 qui a obtenu un score parmi les 10 derniers pour cent. De plus, le nouveau GPT a surpassé d’autres grands modèles de langage (LLM) à la pointe de la technologie dans une variété de tests de référence. La société affirme également que le nouveau système a atteint des performances record en termes de « factualité, de maniabilité et de refus de sortir des garde-corps » par rapport à son prédécesseur.

OpenAI indique que le GPT-4 sera mis à disposition à la fois pour ChatGPT et l’API. « GPT-4 est plus fiable, créatif et capable de gérer des instructions beaucoup plus nuancées que GPT-3.5 », a écrit l’équipe OpenAI.

La fonction d’entrée multimodale ajoutée générera des sorties de texte – qu’il s’agisse de langage naturel, de code de programmation ou autre – sur la base d’une grande variété d’entrées mixtes de texte et d’image. Fondamentalement, vous pouvez désormais numériser des rapports de marketing et de vente, avec tous leurs graphiques et chiffres ; les manuels et les manuels d’atelier – même les captures d’écran fonctionneront – et ChatGPT résumera désormais les différents détails dans les petits mots que nos seigneurs d’entreprise comprennent le mieux.

Ces sorties peuvent être formulées de différentes manières pour apaiser vos responsables, car le système récemment mis à niveau peut (dans des limites strictes) être personnalisé par le développeur de l’API. « Plutôt que la personnalité classique de ChatGPT avec une verbosité, un ton et un style fixes, les développeurs (et bientôt les utilisateurs de ChatGPT) peuvent désormais prescrire le style et la tâche de leur IA en décrivant ces directions dans le message » système «  », a écrit mardi l’équipe OpenAI.

Développement…

Source-145