GitHub rend Copilot Chat généralement disponible, permettant aux développeurs de poser des questions sur le code

Plus tôt cette année, GitHub a déployé Copilot Chat, un chatbot centré sur la programmation de type ChatGPT pour les organisations abonnées à Copilot for Business. Copilot Chat est plus récemment arrivé aux clients Copilot individuels – ceux qui paient 10 $ par mois – en version bêta. Et maintenant, GitHub lance Chat en disponibilité générale pour tous les utilisateurs.

À partir d’aujourd’hui, Copilot Chat est disponible dans la barre latérale des IDE de Microsoft, Visual Studio Code et Visual Studio – inclus dans les niveaux payants de GitHub Copilot et gratuit pour les enseignants, étudiants et responsables vérifiés de certains projets open source.

« En tant que foyer des développeurs du monde entier, nous avons mis sur le marché ce qui est désormais l’outil de développement d’IA le plus largement adopté de l’histoire », a déclaré Shuyin Zhao, vice-président de la gestion des produits chez GitHub, à TechCrunch dans une interview par courrier électronique. « Et le code terminé n’était que le début. »

Peu de choses ont changé dans Copilot Chat depuis la version bêta.

Le chatbot est toujours alimenté par GPT-4, le modèle d’IA générative phare d’OpenAI, spécialement adapté aux scénarios de développement. Les développeurs peuvent demander à Copilot Chat en langage naturel d’obtenir des conseils en temps réel, par exemple en demandant à Copilot Chat d’expliquer des concepts, de détecter des vulnérabilités ou d’écrire des tests unitaires.

Comme tous les modèles d’IA générative, le modèle qui sous-tend Copilot Chat, GPT-4, a été formé sur des données accessibles au public, dont certaines sont protégées par le droit d’auteur ou sous une licence restrictive. Les fournisseurs, dont GitHub, affirment que la doctrine de l’utilisation équitable les protège des réclamations en matière de droits d’auteur. Mais cela n’a pas empêché les codeurs d’intenter des recours collectifs contre GitHub, Microsoft (la société mère de GiHub) et OpenAI pour ce qu’ils prétendent être des licences open source et des violations de propriété intellectuelle.

J’ai demandé à Zhao si les propriétaires de bases de code auraient désormais la possibilité de se retirer de la formation s’ils le souhaitaient. Elle a déclaré qu’il n’y avait pas de nouveau mécanisme pour cela avec le lancement plus large de Copilot Chat et a plutôt suggéré que les propriétaires de bases de code rendent leurs référentiels privés pour éviter qu’ils ne soient inclus dans les futurs ensembles de formation.

Je dois imaginer que les propriétaires de bases de code n’apprécieront pas trop cette suggestion – il existe de nombreuses raisons de garder public le code protégé par le droit d’auteur, la moindre d’entre elles étant la chasse aux bogues en crowdsourcing. Mais GitHub n’est visiblement pas disposé à céder sur la désinscription des données de formation – ou pas encore, du moins.

Les modèles d’IA générative, y compris GPT-4, ont également tendance à halluciner ou à inventer des faits avec assurance – ce qui est particulièrement problématique dans le domaine du codage. Selon une étude récente de Stanford, les développeurs qui utilisent des assistants IA pour coder ont tendance à produire du code moins sécurisé que ceux qui n’utilisent pas d’assistants IA, en partie parce que les assistants IA introduisent des extraits de code bogués ou obsolètes.

Zhao a déclaré que GPT-4 fonctionne « mieux » contre les hallucinations par rapport à l’ancien modèle qui alimentait autrefois Copilot et a souligné des fonctionnalités d’atténuation des exploits telles que des filtres pour les modèles de code non sécurisés, qui informent les utilisateurs de Copilot Chat des vulnérabilités telles que les informations d’identification codées en dur, les injections SQL et injections de chemin. Mais elle a souligné l’importance d’un examen humain attentif de tout code suggéré par l’IA.

« GitHub Copilot est alimenté par les modèles d’OpenAI, que nous avons trouvés comme étant les meilleurs modèles pour les services que nous proposons aujourd’hui », a déclaré Zhao. « Nous sommes dans une position très solide pour continuer à fournir aux développeurs les outils d’IA dont ils ont besoin pour créer des logiciels meilleurs et plus sécurisés à grande échelle – et pour s’amuser pendant qu’ils le font. »

En octobre, Satya Nadella, PDG de Microsoft, a déclaré aux analystes que Copilot comptait 1 million d’utilisateurs payants et environ 37 000 entreprises clientes. Mais il incombe à GitHub de rendre Copilot encore plus attractif, de peur de perdre du terrain face à ses concurrents – et, d’ailleurs, de perdre de l’argent.

Selon un article du Wall Street Journal, Copilot perd en moyenne 20 $ par mois et par utilisateur, certains clients coûtant à GitHub jusqu’à 80 $ par mois. Le prix élevé de l’exécution des modèles d’IA sous-jacents serait à blâmer – un problème que la startup de codage GenAI a également rencontré, l’obligeant à s’arrêter début décembre dernier.

Alors que GitHub a du mal à rentabiliser Copilot, Amazon continue de mettre à niveau CodeWhisperer, peut-être le rival le mieux doté en ressources de Copilot.

En avril, Amazon a rendu CodeWhisperer gratuit pour les développeurs, sans aucune restriction d’utilisation. Ce mois-là a également vu le lancement de CodeWhisperer Professional Tier, qui a ajouté l’authentification unique avec l’intégration d’AWS Identity and Access Management ainsi que des limites plus élevées d’analyse des vulnérabilités de sécurité. Un plan d’entreprise pour CodeWhisperer a été lancé en septembre. Et en début novembre, Amazon a « optimisé » CodeWhisperer pour fournir suggestions « améliorées » pour le développement d’applications sur MongoDB, le programme de gestion de bases de données open source.

Outre CodeWhisperer, Copilot a des concurrents dans des startups comme Magic, Tabnine, Codegen et Laredo, ainsi que dans des modèles open source comme Code Llama de Meta et StarCoder de Hugging Face et ServiceNow.

Source-146