Chaque fois que Microsoft lançait une fonctionnalité majeure d’IA cette année, je ne pouvais m’empêcher d’être plus sceptique quant à la nouvelle orientation de l’entreprise. Voici Microsoft, un géant notoirement conservateur et lent, qui a remodelé ses produits autour de l’intelligence artificielle peu de temps après que la plupart des gens ont appris l’existence de l’IA générative. La dernière fois qu’il a effectué un changement aussi radical, nous avons eu Windows 8, une tentative ratée de rendre son système d’exploitation phare compatible avec les tablettes et les écrans tactiles.
Aujourd’hui, l’entreprise place l’IA au cœur de Windows et je me demande : Microsoft se lance-t-il dans l’intelligence artificielle pour réellement améliorer ses produits ? Ou essaie-t-il simplement de se revendiquer en tant qu’innovateur en matière d’IA et de prier pour que la technologie soit réellement à la hauteur du battage médiatique ? À ce stade, c’est vraiment difficile à dire.
Comme l’ont montré le Zune, la WebTV et Windows Phone, Microsoft n’est pas très doué en matière de timing. Ses produits arrivent souvent soit trop tôt pour être utiles (comme dans le cas de la lenteur de la WebTV), soit bien trop tard pour avoir un impact (comme le véritablement génial Zune HD). Mais lorsque la société a dévoilé son Bing Chat basé sur l’IA plus tôt cette année, elle était parfaitement positionnée pour profiter du succès de ChatGPT, qui aurait alors atteint 100 millions d’utilisateurs en seulement deux mois. Selon les analystes d’UBS, cela aurait fait de ChatGPT l’application grand public connaissant la croissance la plus rapide de l’histoire. Quel meilleur moment pour associer la puissance de l’IA générative à l’un de ses produits notoirement assiégés ? Microsoft n’avait rien à perdre.
Après avoir investi un total de 13 milliards de dollars dans OpenAI, le créateur de ChatGPT (et acquis une participation de 49 % dans le processus), Microsoft était probablement impatient de montrer son nouveau jouet brillant avant Google et d’autres. L’introduction de Bing Chat a officiellement lancé l’année de l’IA de Microsoft : Copilot a été lancé sur Edge, des produits Microsoft 365 comme Word et Powerpoint et ont finalement fait leur chemin vers Windows 11. Plus surprenant encore, la société a récemment annoncé que Copilot arriverait sur Windows 10 — un signe qu’il souhaite que les fonctionnalités de l’IA soient présentées au plus grand nombre. (Windows 11 représenterait 26 % des installations Windows, tandis que Windows 10 en représente encore 69 %. En ciblant les deux plates-formes, Copilot pourrait potentiellement atteindre jusqu’à 1,4 milliard d’utilisateurs.)
Il ne fait aucun doute que Copilot fait une excellente première impression. Tapez quelques mots (ou prononcez-les à voix haute), et il revient avec des réponses directes à vos questions, comme un assistant ultra-intelligent. Il n’y a pas de publicité à parcourir et vous n’avez qu’à interagir avec des liens supplémentaires si vous le souhaitez. C’est un aperçu d’un monde au-delà des moteurs de recherche, dans lequel l’IA pourrait nous aider à nous guider dans un paysage médiatique de plus en plus chaotique. Les Copilots de Microsoft peuvent également être utiles dans des applications spécifiques : dans Edge, ils peuvent résumer la page Web que vous consultez ; cela peut aider à transcrire et générer des points d’action lors des réunions Teams ; et cela peut aider à découvrir des paramètres difficiles à trouver dans Windows (par exemple, vous pouvez simplement taper « Comment activer le mode nuit ? » pour l’activer).
Mais le vernis confiant de Copilot cache le fait qu’il commet souvent des erreurs et peut parfois mal comprendre complètement vos questions. Il est beaucoup moins réactif que l’utilisation d’un moteur de recherche classique, car de nombreux traitements opaques de l’IA se produisent en arrière-plan. Et lors de mes tests, il plante également plus souvent que vous ne le pensez, ce qui nécessite un « redémarrage » de votre session (mais au moins, il ne fait pas clignoter un écran bleu comme Windows).
Dans le but de tempérer nos attentes, Microsoft a publié une note utile sur le chat IA de Bing : « Bing est alimenté par l’IA, des surprises et des erreurs sont donc possibles. Veuillez partager vos commentaires afin que nous puissions nous améliorer ! » Microsoft semble faire preuve d’un peu d’humilité ici en reconnaissant que son chat IA n’est pas parfait, et il essaie de gagner quelques points en disant qu’il écoute vos commentaires. Mais surtout, cet avertissement sert de porte de sortie à Microsoft. Il peut vanter la capacité de Copilot à rédiger des essais pour vous et à tenir des conversations vaguement réalistes, mais dès que cela échoue, l’entreprise peut simplement dire : « Ce n’est qu’une version bêta, MDR ! »
Le grand test pour les Copilots de Microsoft et autres outils d’IA générative se résume à une seule chose : la confiance. Un utilisateur peut-il être sûr qu’il fournira les informations pertinentes lorsqu’il posera une question ? Pouvons-nous être sûrs que Copilow comprendra correctement notre requête ? Aaron Woodman, vice-président du marketing Windows chez Microsoft, nous dit que la confiance dépendra en fin de compte des utilisateurs qui « bottent les pneus » par eux-mêmes et voient les performances de Copilot. « Je pense que ce type de croissance organique est celui que nous allons voir au fil du temps », a-t-il déclaré dans une interview avec Engadget lors du lancement de Windows Copilot en septembre. « Et je parie que ce sera explosif parce que la valeur est là, et je pense que les clients le verront très rapidement. »
Woodman pense également que les utilisateurs comprendront que Copilot ne sera pas toujours parfait, surtout en ces premiers jours. « Bizarrement, je pense que nous sommes probablement plus empathiques avec les gens et comprenons où ils en sont en matière de croissance qu’avec la technologie », a-t-il déclaré. « Je pense que la meilleure chose que nous puissions faire est de le reconnaître honnêtement, d’être transparent à ce sujet. À un certain niveau, dans chaque conversation dans laquelle nous participons, nous essayons de nous appuyer sur [that] c’est un processus de croissance. Nous voulons nous assurer que vous comprenez les documents de référence. Je pense que les gens comprendront que nous essayons d’accélérer la mise en place [new] technologie pour eux. »
J’utilise les solutions d’IA de Microsoft depuis le lancement de Bing Chat plus tôt cette année, et même si elles sont utiles pour des tâches simples, comme créer un tableau de spécifications comparant deux produits, cela n’a pas vraiment changé ma façon de travailler. Microsoft a également dû sérieusement restreindre les capacités de Bing Chat dès le début, après avoir commencé à se disputer avec les utilisateurs et à émettre des réponses inquiétantes. Dans Windows 11, Copilot peut parfois m’aider à trouver des paramètres tels que le mode sombre, mais il ne peut pas toujours afficher les commandes dans le volet Copilot, et parfois il m’envoie simplement aux menus de paramètres généraux s’il ne comprend pas ce que je fais. Je demande.
Plus récemment, j’ai eu des conversations décevantes avec Bing lorsque je lui ai demandé si c’était le bon moment pour acheter une Nintendo Switch (il lui a fallu quelques incitations pour évoquer des rumeurs sur un éventuel suivi de Switch à venir l’année prochaine), et son La capacité à répondre à des questions autour des images est encore moins utile que la recherche d’images de Google.
Lorsque j’ai pris une photo du babyphone de mon enfant et demandé « Qu’est-ce que c’est ? », Bing était conscient de sa fonction, mais il s’est trompé sur le modèle et le fabricant. Cette requête a également pris cinq secondes. La recherche d’images Google a pris une demi-seconde et l’a correctement identifié comme étant Eufy Space Monitor. Marquez un pour la recherche traditionnelle (et oui, je sais qu’elle est également alimentée par son propre ensemble de modèles de vision par ordinateur).
Nous pouvons nous tourner vers Github Copilot de Microsoft, lancé en novembre 2021, comme un moyen pour les utilisateurs d’apprendre à travailler avec l’IA. Il est principalement destiné à servir de partenaire aux côtés d’un programmeur expérimenté : il recherchera les problèmes potentiels et pourra même créer du code simple.
Selon le développeur Aidan Tilgner, Github Copilot peut être véritablement utile pour les codeurs, à condition que vous maîtrisiez vos attentes. Dans l’article « Programmation en binôme GitHub Copilot AI : actif ou passif ? » les auteurs Arghavan Moradi Dakhel, Vahid Majdinasab, Amin Nikanjam, Foutse Khomh, Michel C.Desmarais et Zhen Ming Jiang ont trouvé Github Copilot tout aussi utile, mais notez « il peut également devenir un handicap s’il est utilisé par des novices, ceux qui ne le sont peut-être pas. familier avec le contexte du problème et les méthodes de codage correctes.
« Copilot suggère des solutions qui peuvent être boguées et difficiles à comprendre, et qui peuvent être acceptées comme des solutions correctes par les novices », ajoutent les auteurs. « L’ajout d’un code aussi bogué et complexe dans des projets logiciels peut avoir un impact considérable sur leur qualité. »
En s’appuyant autant sur Copilots à l’avenir, Microsoft pourrait également se lier trop étroitement à OpenAI, une jeune entreprise qui a récemment traversé l’un des week-ends les plus instables de l’histoire de la Silicon Valley. Le conseil d’administration d’OpenAI a licencié le PDG Sam Altman, mais après une pression interne importante (et quelques cajoleries de la part du PDG de Microsoft, Satya Nadella), il l’a finalement réembauché quelques jours plus tard. Si OpenAI traverse un autre événement tumultueux, ce ne sera pas seulement l’investissement de 13 milliards de dollars de Microsoft qui sera en danger : ce seront les projets futurs de l’entreprise pour pratiquement tous ses produits.
Selon Windows Central, la prochaine mise à jour majeure de Windows de Microsoft, « Hudson Valley », pourrait arriver l’année prochaine avec de nombreuses améliorations de l’IA. Cela inclut la possibilité d’analyser le contenu affiché dans les chats vidéo, un Copilot amélioré qui peut mémoriser tout ce que vous avez fait sur votre PC et une meilleure recherche à l’échelle du système. Certaines fonctionnalités peuvent également nécessiter des processeurs avec NPU, comme le dernier lot de puces d’AMD et le nouveau matériel Core Ultra d’Intel. Cela est similaire aux fonctionnalités de Windows Studio Effects telles que le flou d’arrière-plan et le cadrage automatique, qui nécessitent également des NPU.
La seule constante autour de l’IA de nos jours est que tout change rapidement. Depuis que j’ai commencé à écrire cet article, Microsoft a annoncé que Copilot serait mis à niveau avec les modèles GPT-4 Turbo et Dall-E 3 plus puissants, ce qui les rendrait encore plus performants. Peut-être que Microsoft et OpenAI seront éventuellement en mesure de résoudre tous les problèmes que j’ai rencontrés avec Copilot jusqu’à présent et, à terme, de fournir un outil d’IA transformateur facilement accessible à tous. Mais j’espérais également le meilleur en ce qui concerne les plans Duo et Neo à double écran de la société, et tout ce que j’ai obtenu en retour a été une déception.
Cet article contient des liens d’affiliation ; si vous cliquez sur un tel lien et effectuez un achat, nous pouvons gagner une commission.