Microsoft lance 7 modèles d'IA maison pour réduire sa dépendance à OpenAI

Microsoft a dévoilé sept modèles d'IA propriétaires lors de la Build 2026, dont son premier modèle de raisonnement, signalant un pivot stratégique de la dépendance à OpenAI vers l'autosuffisance en intelligence artificielle.

Le modèle de raisonnement MAI-Thinking-1 de Microsoft, avec 35 milliards de paramètres actifs et une fenêtre de contexte de 128 000 tokens, défie directement Claude d'Anthropic et Gemini de Google, menaçant de remodeler le marché des modèles d'IA, estimé à plus de 200 milliards de dollars.

"Chaque entreprise devrait passer de la consommation d'un modèle de frontière à une participation pleine à la frontière", a déclaré Satya Nadella, directeur général de Microsoft, sur scène à la Build à San Francisco.

Le modèle, entraîné sans distillation de systèmes tiers, égalise les principaux concurrents sur les benchmarks clés d'ingénierie logicielle, selon Microsoft. La société a également publié MAI-Code-1-Flash, un modèle de codage de 5 milliards de paramètres intégré à GitHub Copilot et Visual Studio Code, ainsi que des modèles de génération d'images, de transcription et de voix, pour un total de sept offres.

Cette décision réduit la dépendance de Microsoft à OpenAI, dans lequel elle a investi 13 milliards de dollars, et à Anthropic, où elle détient une participation de 5 milliards de dollars. Microsoft peut désormais exécuter l'inférence sur sa propre infrastructure Azure, capturant ainsi les marges auparavant versées aux fournisseurs de modèles tiers. L'action se négocie à environ 30 fois les bénéfices à terme.

La gamme de modèles et le positionnement concurrentiel

MAI-Thinking-1 est conçu pour les instructions complexes en plusieurs étapes, le raisonnement à long contexte et la génération de code, le plaçant en concurrence directe avec Claude Sonnet 4.6 d'Anthropic et Gemini 3.5 Flash de Google. Microsoft a déclaré qu'il surpassait GPT-5-5 d'OpenAI en termes d'efficacité des coûts par un facteur de 10 lorsqu'il est affiné pour les workflows de conseil de McKinsey, selon Mustafa Suleyman, directeur général de Microsoft AI.

Le modèle de codage, MAI-Code-1-Flash, fonctionne avec 5 milliards de paramètres et est décrit comme "ultra-efficace en inférence" par Kyle Daigle, responsable du marketing développeur de Microsoft et chef de l'exploitation de GitHub. Il est disponible immédiatement dans GitHub Copilot et Visual Studio Code, donnant aux outils de développement de Microsoft un moteur propriétaire plutôt que de dépendre de fournisseurs de modèles externes.

Sur le front multimodal, MAI-Image-2.5 et sa variante Flash prennent en charge la génération texte-à-image et l'édition d'images, Microsoft affirmant des scores Arena supérieurs à ceux du modèle d'image d'Anthropic. MAI-Transcribe-1.5 traite l'audio cinq fois plus rapidement que les systèmes concurrents, tandis que MAI-Voice-2 ajoute 15 langues et de nouvelles options vocales.

Au-delà des modèles : Agents, matériel et outils développeurs

Microsoft a également présenté Scout, un agent d'IA d'entreprise basé sur le framework OpenClaw et intégré directement dans les applications Microsoft 365, notamment Outlook, Teams et OneDrive. Scout peut automatiser la gestion des e-mails, l'organisation du calendrier, le reporting des dépenses et le suivi des tâches, fonctionnant comme un assistant permanent pour les entreprises.

La société a répondu aux préoccupations de sécurité concernant les agents autonomes avec Microsoft Execution Containers, un bac à sable au niveau du système d'exploitation qui restreint ce que les agents d'IA peuvent accéder sur les appareils Windows. Lors d'une démonstration en direct, Microsoft a montré que même avec les couches de sécurité propres à OpenClaw désactivées, MXC empêchait l'agent de supprimer des fichiers du bureau — un scénario qui aurait réussi il y a six mois, selon la société.

Pour les développeurs créant des applications d'IA locales, Microsoft a dévoilé le Surface RTX Spark Dev Box, une station de travail compacte alimentée par la puce RTX Spark de Nvidia avec 128 gigaoctets de mémoire unifiée et 1 PFLOP de calcul IA. L'appareil peut exécuter des modèles allant jusqu'à 120 milliards de paramètres localement et prend en charge une fenêtre de contexte d'un million de tokens, ciblant les développeurs qui ont besoin de prototyper et tester des agents d'IA sans coûts cloud.

Côté logiciel, Microsoft a publié Coreutils pour Windows, apportant plus de 75 utilitaires de ligne de commande Linux — réécrits en Rust — au terminal natif de Windows. La société a également présenté en avant-première WSL Containers pour la gestion native de conteneurs Linux et un Terminal Intelligent capable de lire les erreurs, d'analyser les causes et d'exécuter des correctifs en plusieurs étapes de manière autonome.

Implications pour les investisseurs

Le portefeuille de modèles de Microsoft crée à la fois des opportunités et des risques. La société peut désormais proposer aux développeurs une inférence à moindre coût via ses propres modèles fonctionnant sur Azure, comprimant potentiellement les marges d'OpenAI et d'Anthropic tout en élargissant le propre pool de revenus IA de Microsoft. Nvidia devrait bénéficier du partenariat Surface Dev Box, qui place sa puce RTX Spark dans l'écosystème matériel de Microsoft.

La question plus large est de savoir si l'entrée tardive de Microsoft dans les modèles propriétaires peut gagner du terrain face aux leaders établis. OpenAI et Anthropic cherchent tous deux à entrer en bourse cette année, Anthropic ayant déposé une demande confidentielle d'introduction en bourse en juin. L'avantage de Microsoft réside dans la distribution : GitHub compte plus de 100 millions de développeurs, Windows fonctionne sur plus d'un milliard d'appareils et Microsoft 365 sert des centaines de millions d'utilisateurs en entreprise. Chaque canal transporte désormais le propre moteur d'IA de Microsoft plutôt qu'un modèle tiers.

Cet article est fourni à titre d'information uniquement et ne constitue pas un conseil en investissement.