Récapitulatif de ChatGPT-4 – toutes les nouvelles fonctionnalités annoncées

Rafraîchir

(Crédit image : OpenAI)

Bienvenue dans notre couverture du livestream OpenAI GPT-4 Developer ! OpenAI (s’ouvre dans un nouvel onglet) a déjà annoncé le nouveau modèle GPT-4 dans une annonce de produit sur son site Web aujourd’hui et maintenant ils le suivent avec un aperçu en direct pour les développeurs.

Les premières promesses semblent impressionnantes. OpenAI affirme que GPT-4 peut « absorber et générer jusqu’à 25 000 mots de texte ». C’est bien plus que les 3 000 mots que ChatGPT peut gérer. Mais la véritable mise à niveau réside dans les capacités multimodales de GPT-4, permettant au chatbot AI de gérer les images ainsi que le texte. Sur la base d’un événement de presse Microsoft plus tôt cette semaine, on s’attend à ce que les capacités de traitement vidéo finissent par emboîter le pas.

Nous sommes maintenant à un peu moins de 30 minutes du flux en direct des développeurs OpenAI GPT-4, que vous pouvez visionner sur YouTube d’OpenAI (s’ouvre dans un nouvel onglet) canaliser.

OpenAI n’est pas la seule entreprise à faire une grande annonce sur l’IA aujourd’hui. Plus tôt, Google a annoncé ses derniers outils d’IA, y compris une nouvelle fonctionnalité d’IA générative pour Google Docs et Gmail.

Diffusion en direct OpenAI GPT-4

(Crédit image : OpenAI/YouTube)

Et c’est parti ! Greg Brockman est ici pour discuter du nouveau modèle GPT-4. Vous pouvez aller sur le Discord d’OpenAI (s’ouvre dans un nouvel onglet) pour soumettre une question.

Diffusion en direct OpenAI GPT-4

(Crédit image : OpenAI/YouTube)

Tout d’abord, nous nous concentrons sur la fonctionnalité Chat Completions Playground qui fait partie du kit API auquel les développeurs ont accès. Cela permet aux développeurs de former et d’orienter le modèle GPT vers les objectifs des développeurs.

Dans cette démo, GPT-3.5, qui alimente l’aperçu de recherche gratuit de ChatGPT, tente de résumer le billet de blog que le développeur a entré dans le modèle, mais n’y parvient pas vraiment, alors que GPT-4 gère le texte sans problème. Bien qu’il s’agisse définitivement d’une fonctionnalité destinée aux développeurs, il est intéressant de voir les fonctionnalités améliorées du nouveau modèle d’OpenAI.

Diffusion en direct du développeur OpenAI GPT-4.

(Crédit image : OpenAI/YouTube)

Prochaine étape : construire avec GPT-4. Dans cette démo, OpenAI utilise GPT-4 pour créer un bot Discord. OpenAI affirme que GPT-3.5 ne pouvait pas du tout gérer cette tâche, d’autant plus que le bot est invité à gérer à la fois les entrées de texte et d’image. Les capacités multimodales de GPT-4 permettent aux développeurs d’utiliser même des images.

Bien que le bot ne puisse pas gérer l’entrée d’image instantanément, et ce n’est toujours pas sans bogues, il a pu reconnaître l’image fournie sur Discord et fournir un contexte à partir de l’image. Certainement, quelque chose que le ChatGPT gratuit actuel ne peut pas faire.

Diffusion en direct OpenAI GPT-4

(Crédit image : OpenAI/YouTube)

D’accord, c’est vraiment cool. En utilisant le bot Discord créé dans le GPT-4 Playground, OpenAI a pu prendre une photo d’une maquette de site Web manuscrite (voir photo) et la transformer en un site Web fonctionnel avec du nouveau contenu généré pour le site Web. Bien qu’OpenAI affirme que cet outil est encore en cours de développement, cela pourrait être un énorme coup de pouce pour ceux qui espèrent créer un site Web sans avoir l’expertise nécessaire pour coder sans l’aide de GPT.

Diffusion en direct OpenAI GPT-4

(Crédit image : OpenAI/YouTube)

Et maintenant, nous obtenons que GPT fasse des impôts. Bien que GPT ne soit pas un professionnel de la fiscalité, il serait intéressant de voir GPT-4 ou un modèle ultérieur transformé en un outil fiscal permettant aux utilisateurs de contourner le secteur de la préparation des déclarations et de gérer eux-mêmes les déclarations les plus compliquées.

Et c’est tout pour le livestream du développeur GPT-4. Bien que nous n’ayons pas pu voir certaines des fonctionnalités destinées aux consommateurs que nous aurions aimées, il s’agissait d’un flux en direct axé sur les développeurs et nous ne sommes donc pas très surpris. Pourtant, il y avait certainement quelques points forts, tels que la création d’un site Web à partir d’un dessin manuscrit, et voir les capacités multimodales en action était passionnant. Espérons que d’autres seront révélés dans un proche avenir.

Source-131