Microsoft, partenaire d’OpenAI, met l’accent sur le développement de ses propres modèles d’intelligence artificielle, notamment la famille « MAI ». Le lancement des modèles Phi-4-multimodal et Phi-4-mini montre leur capacité à traiter divers types d’entrées. Ces modèles, disponibles via Azure AI Foundry, surpassent les solutions concurrentes sur certains critères. En parallèle, Microsoft explore également des solutions tierces et développe des modèles de raisonnement pour rivaliser avec OpenAI, suite à des tensions sur le partage technologique.
Microsoft, un fervent partenaire d’OpenAI, a souvent mis en avant des produits tels que Copilot en soulignant leur accès aux derniers modèles de ChatGPT. Cependant, il semble que la société s’engage maintenant à promouvoir ses propres modèles d’intelligence artificielle dans sa suite logicielle bien connue, tout en développant un concurrent aux modèles de raisonnement d’OpenAI au sein de la gamme « GPT-o ».
D’après des informations récentes, les équipes de l’unité IA de Microsoft ont terminé la formation d’une « nouvelle famille de modèles d’IA », actuellement en cours de développement sous le nom de code « MAI ». Les membres de l’équipe espèrent en interne que ces modèles seront presque aussi performants que ceux des leaders du marché comme OpenAI et Anthropic.
Développer sa propre infrastructure IA
À la fin février, Microsoft a lancé de nouveaux modèles de langage plus petits, appelés Phi-4-multimodal et Phi-4-mini. Ces modèles possèdent des capacités multimodales, ce qui leur permet de traiter des entrées textuelles, vocales et visuelles, à l’instar de ChatGPT d’OpenAI et de Gemini de Google.
Les nouveaux modèles d’IA sont déjà accessibles aux développeurs via Azure AI Foundry de Microsoft, ainsi que sur des plateformes tierces comme HuggingFace et le catalogue API de NVIDIA. Les tests indiquent que le modèle Phi-4 surpasse déjà les derniers modèles de la série Gemini 2.0 de Google sur plusieurs critères de performance.
“C’est l’un des rares modèles ouverts à avoir intégré avec succès la synthèse vocale tout en atteignant des performances équivalentes à celles du modèle GPT-4o,” a déclaré Microsoft dans un article de blog. L’entreprise prévoit de commercialiser ses modèles « MAI » à travers son service Azure.
Concurrence et collaboration avec d’autres acteurs
En parallèle de l’expérimentation de ses modèles d’IA internes pour Copilot, Microsoft se penche également sur des solutions tierces comme DeepSeek, xAI et Meta. DeepSeek a récemment suscité de l’intérêt grâce à ses performances élevées à un coût de développement largement réduit. De nombreuses entreprises ont déjà opté pour cette solution, revendiquant un rapport coût-bénéfice théorique de plus de 500 % sur une base quotidienne.
Nous faisons avancer nos ambitions en matière d’IA avec le lancement des modèles distillés DeepSeek R1 7B & 14B pour les PC Copilot+ via Azure AI Foundry. C’est une étape cruciale dans notre démarche pour faire de Windows la plateforme privilégiée pour l’IA, intégrant harmonieusement l’intelligence du cloud à notre écosystème.
En plus de se concentrer sur ses propres modèles d’IA pour remplacer l’infrastructure GPT d’OpenAI pour Copilot, Microsoft s’active à développer ses propres modèles de raisonnement. Cela le met en concurrence directe avec des produits d’OpenAI comme GPT-o1 et des start-ups chinoises telles que DeepSeek, qui offrent des capacités similaires de raisonnement.
Le développement d’un modèle de raisonnement interne a été accéléré récemment en raison des tensions entre les équipes de Microsoft et d’OpenAI sur le partage de technologie. Des sources indiquent que Mustafa Suleyman, responsable IA chez Microsoft, et OpenAI ont eu des désaccords concernant le manque de transparence de ce dernier sur le fonctionnement complexe de ses modèles d’IA tels que GPT-o1.
Les modèles de raisonnement sont considérés comme la prochaine avancée majeure dans le domaine de l’intelligence artificielle, car ils promettent une compréhension plus approfondie des requêtes, une déduction logique et des capacités de résolution de problèmes améliorées. Microsoft affirme également que son modèle Phi-4 excelle dans le raisonnement linguistique, mathématique et scientifique visuel.