GitHub Copilot, le service de GitHub qui suggère intelligemment des lignes de code, est désormais disponible dans un plan pour les entreprises des mois après son lancement pour les utilisateurs individuels et les éducateurs.
Appelé GitHub Copilot for Business, le nouveau plan, qui coûte 19 $ par utilisateur et par mois, comprend toutes les fonctionnalités du niveau Copilot à licence unique, ainsi que les licences d’entreprise et les contrôles des politiques. Cela inclut une bascule qui permet aux administrateurs informatiques d’empêcher que le code suggéré correspondant au code public sur GitHub ne soit montré aux développeurs, une réponse probable aux controverses sur la propriété intellectuelle qui se préparent autour de Copilot.
Disponible en tant qu’extension téléchargeable pour les environnements de développement, y compris Microsoft Visual Studio, Neovim et JetBrains, Copilot est alimenté par un modèle d’IA appelé Codex, développé par OpenAI, qui est formé sur des milliards de lignes de code public pour suggérer des lignes de code supplémentaires et des fonctions données le contexte du code existant. Copilot – qui comptait plus de 400 000 abonnés en août – peut proposer une approche ou une solution de programmation en réponse à une description de ce qu’un développeur veut accomplir (par exemple, « Say hello world »), en s’appuyant sur sa base de connaissances et le contexte actuel.
Au moins une partie du code sur lequel le Codex a été formé est protégée par le droit d’auteur ou sous une licence restrictive, ce que certains groupes de défense ont contesté. Les utilisateurs ont pu demander à Copilot de générer du code à partir de Quake, des extraits de code dans des bases de code personnelles et des exemples de code tirés de livres tels que « Mastering JavaScript » et « Think JavaScript » ; GitHub lui-même admet que, environ 1 % du temps, les suggestions Copilot contiennent des extraits de code de plus de 150 caractères environ qui correspondent aux données d’entraînement.
GitHub affirme que l’utilisation équitable – la doctrine de la loi américaine qui permet l’utilisation de matériel protégé par le droit d’auteur sans avoir à obtenir au préalable l’autorisation du titulaire des droits – le protège dans le cas où Copilot a été sciemment ou inconsciemment développé contre du code protégé par le droit d’auteur. Mais tout le monde n’est pas d’accord. La Free Software Foundation, une organisation à but non lucratif qui défend le mouvement du logiciel libre, a qualifié Copilot d' »inacceptable et injuste ». Et Microsoft, GitHub et OpenAI sont poursuivis dans le cadre d’un recours collectif qui les accuse d’avoir enfreint la loi sur le droit d’auteur en autorisant Copilot à régurgiter des sections de code sous licence sans fournir de crédit.
La responsabilité de GitHub mise à part, certains experts juridiques ont fait valoir que Copilot pourrait mettre les entreprises en danger si elles intégraient involontairement des suggestions protégées par le droit d’auteur de l’outil dans leur logiciel de production. Comme le note Elaine Atwell dans un article sur le blog d’entreprise de Kolide, étant donné que Copilot supprime le code de ses licences, il est difficile de dire quel code est autorisé à déployer et lequel pourrait avoir des conditions d’utilisation incompatibles.
La tentative de GitHub de rectifier cela est un filtre, introduit pour la première fois sur la plate-forme Copilot en juin, qui vérifie les suggestions de code avec leur code environnant d’environ 150 caractères par rapport au code public GitHub et masque les suggestions s’il y a une correspondance ou une « quasi-correspondance ». Mais c’est une mesure imparfaite. Tim Davis, professeur d’informatique à la Texas A&M University, a découvert que l’activation du filtre amenait Copilot à émettre de gros morceaux de son code protégé par le droit d’auteur, y compris tout le texte d’attribution et de licence.
GitHub prévoit d’introduire des fonctionnalités supplémentaires en 2023 visant à aider les développeurs à prendre des décisions éclairées quant à l’utilisation ou non des suggestions de Copilot, y compris la possibilité d’identifier les chaînes correspondant au code public avec une référence à ces référentiels. Et pour les clients GitHub Copilot for Business, GitHub affirme qu’il ne conservera pas les extraits de code pour la formation ou le partage de code, que les données proviennent de référentiels publics, de référentiels privés, de référentiels non GitHub ou de fichiers locaux.
Mais il n’est pas clair si ces mesures suffiront à apaiser les craintes des entreprises concernant les contestations judiciaires.