Jay Hack, chercheur en IA avec une formation en traitement du langage naturel et en vision par ordinateur, s’est rendu compte il y a plusieurs années que les grands modèles de langage (LLM) – pensez au GPT-4 ou ChatGPT d’OpenAI – avaient le potentiel de rendre les développeurs plus productifs en traduisant. requêtes en langage naturel dans le code.
Après avoir travaillé chez Palantir en tant qu’ingénieur en apprentissage automatique et créé et vendu Mira, une startup d’achat de cosmétiques basée sur l’IA, Hack a commencé à expérimenter les LLM pour exécuter des demandes d’extraction – le processus de fusion de nouvelles modifications de code avec les principaux référentiels de projets. Avec l’aide d’une petite équipe, Hack a progressivement étendu ces expériences à une plate-forme, Codegen, qui tente d’automatiser autant de tâches d’ingénierie logicielle banales et répétitives que possible en tirant parti des LLM.
« Codegen automatise le travail subalterne de l’ingénierie logicielle en permettant aux agents d’IA d’expédier du code », a déclaré Hack à TechCrunch dans une interview par courrier électronique. « La plateforme permet aux entreprises d’agir beaucoup plus rapidement et élimine les coûts liés à la dette technologique et à la maintenance, permettant ainsi aux entreprises de se concentrer sur l’innovation de produits. »
Alors, on peut se demander ce qui distingue Codegen de l’IA génératrice de code comme GitHub Copilot, Amazon CodeWhisperer et le modèle Salesforce avec lequel Codegen partage un nom ? D’une part, les défis auxquels Codegen s’attaque, dit Hack. Alors que Copilot, CodeWhisperer et d’autres se concentrent sur l’auto-complétion du code, Codegen s’occupe des problèmes « à l’échelle de la base de code » comme les migrations importantes et la refactorisation (c’est-à-dire la restructuration du code d’une application sans altérer ses fonctionnalités).
« Codegen exploite un système multi-agents pour la génération de codes complexes », a expliqué Hack. « Cela implique d’orchestrer un essaim d’agents qui décomposent et résolvent de manière collaborative des tâches volumineuses. De nombreux LLM délibèrent efficacement et s’appuient sur le travail de chacun, [which] donne des résultats nettement meilleurs.
Le produit principal de Codegen est un outil cloud et sur site qui se connecte aux bases de code et aux tableaux de gestion de projet, tels que Jira et Linear, et génère automatiquement des demandes d’extraction pour traiter les tickets d’assistance. La plate-forme peut même mettre en place une partie de l’infrastructure de code et de la journalisation nécessaires, dit Hack – même si ce journaliste n’a pas compris clairement ce que Hack entendait par « infrastructure ».
« Contrairement à d’autres solutions, Codegen offre un niveau d’automatisation plus élevé dans l’exécution de tâches entières pour le compte des développeurs », a déclaré Hack. « Nous récupérons le retard d’une entreprise, trouvons les tickets résolubles, puis faisons appel à une armée d’agents pour trouver le code pertinent et produire une pull request. »
Désormais, Codegen est très prometteur étant donné que même les meilleurs modèles d’IA d’aujourd’hui commettent des erreurs majeures. Par exemple, il est bien établi que les outils de codage génératif peuvent introduire du code non sécurisé, une étude de Stanford suggérant que les ingénieurs logiciels qui utilisent l’IA génératrice de code sont plus susceptibles de provoquer des failles de sécurité dans les applications qu’ils développent.
Hack affirme que Codegen, pour sa part, tente de trouver « le bon équilibre » entre la surveillance humaine et les meilleures pratiques en matière de surveillance du code généré par LLM.
« Il s’agit d’un travail important, et l’ensemble de l’écosystème de développement bénéficierait d’une meilleure compréhension de la manière d’évaluer et de vérifier les résultats du LLM », a déclaré Hack. « Des progrès significatifs devront être réalisés pour que les développeurs aient une confiance généralisée dans les systèmes de génération de code généralisés et automatisés. »
Les investisseurs semblent penser que Codegen va du bon côté, pour ce que ça vaut.
La société a annoncé cette semaine avoir clôturé un tour de table de 16 millions de dollars dirigé par Thrive Capital avec la participation d’investisseurs providentiels, dont le PDG de Quora, Adam D’Angelo, et le co-fondateur d’Instagram, Mike Krieger. La tranche porte le total levé de Codegen à 16,2 millions de dollars et valorise la startup à 60 millions de dollars après l’argent, affirme Hack.
Philip Clark de Thrive a déclaré par e-mail : « En 2023, la plupart des développeurs consacrent encore une part déraisonnable de leur temps à écrire du code pour gérer des tâches de bas niveau telles que les migrations, les refactors, les intégrations et les corrections de bugs. Des entreprises comme Codegen exploitent les LLM pour créer des agents d’IA qui libèrent les ingénieurs de cette corvée. Les développeurs pourront bientôt confier des tâches à des agents afin qu’ils puissent cesser de se soucier du travail logiciel et rester concentrés sur la création de nouveaux produits.
Codegen, basé à San Francisco, n’a pas encore de clients payants : la plateforme est actuellement en incubation avec deux entreprises partenaires « à grande échelle ». Mais Hack prévoit une croissance pour l’année prochaine.
« Nous levons des capitaux importants car l’opportunité de fabriquer un produit aussi substantiel et ambitieux n’est apparue que récemment, et nous voulons nous lancer de toutes nos forces vers le marché », a-t-il déclaré, ajoutant que Codegen prévoit de faire passer ses effectifs de six employés à 10 d’ici la fin de l’année. « Les fonds serviront à accroître notre main-d’œuvre et à soutenir nos infrastructures. »