微軟首款自研推理模型在不依賴蒸餾技術的情況下,於企業級基準測試中挑戰 Anthropic 與 OpenAI。
微軟首款自研推理模型在不依賴蒸餾技術的情況下,於企業級基準測試中挑戰 Anthropic 與 OpenAI。

微軟首款自研推理模型在不依賴蒸餾技術的情況下,於企業級基準測試中挑戰 Anthropic 與 OpenAI。
微軟公司(Microsoft Corp.)週二在 Build 2026 大會上推出首款自研推理模型 MAI-Thinking-1,該模型擁有 350 億活躍參數,直接對 Anthropic 的 Claude 與 OpenAI 的 GPT 系列發起挑戰,劍指企業 AI 市場。
「MAI-Thinking-1 專為處理複雜多步驟指令、長文本推理以及程式碼生成而設計,」微軟開發者部門 CMO 兼 GitHub COO Kyle Daigle 在主題演講前的媒體簡報會上表示。
該模型完全從頭打造,基於商業授權資料進行訓練,未使用來自第三方模型的蒸餾技術,並配備 128,000 個 token 的上下文視窗。微軟指出,獨立評估者對該模型的偏好度高於 Anthropic 的 Claude Sonnet 4.6,且在 SWE Bench Pro 程式碼基準測試中,其表現可與 Claude Opus 4.6 匹敵。該公司同時推出另外六款模型,涵蓋圖像生成、轉錄、語音及程式碼等領域。
此次發布標誌著微軟在自研 AI 開發上邁出迄今為止最深入的一步,在雙方重新談判合作夥伴關係後,降低其對 OpenAI 的依賴。微軟股價目前約為預期盈餘的 33 倍,若自研模型能降低該公司已承諾的每年約 130 億美元 AI 基礎設施成本,將有望受惠。
完整模型家族成形
除了推理模型之外,微軟還推出 MAI-Image-2.5 及其 Flash 變體,用於文字轉圖像生成與編輯,該功能已於 PowerPoint 和 OneDrive 中上線。MAI-Transcribe-1.5 據稱速度較競爭對手的轉錄模型快五倍,將支援 43 種語言。MAI-Voice-2 及其 Flash 變體新增 15 種語言,並提供多種語音選項。MAI-Code-1-Flash 則是一款推理效率極高的程式碼模型,已直接整合至 GitHub Copilot 和 Visual Studio Code 中。
所有模型最終將可透過 Microsoft Foundry 及一個名為 MAI Playground 的新環境取得。這一系列產品的廣度顯示,微軟的意圖是覆蓋完整的 AI 技術堆疊——從推理、程式碼到多模態生成——而非僅依賴單一旗艦模型。
硬體與智能代理擴展版圖
微軟同時推出 Scout,一款主動式個人智能代理,能夠透過 Teams 和 Outlook 處理排程、會議準備及例行任務,無需等待用戶輸入。Scout 將於週二開始向 Frontier 客戶推出。在硬體方面,由 Nvidia 的 RTX Spark 晶片驅動的 Surface RTX Spark Dev Box,可提供高達 1 petaflop 的 AI 算力及 128 GB 統一記憶體,能夠在本地端運行參數規模高達 1,200 億的模型。該產品將於今年稍晚在美國出貨。
該公司透過 Microsoft Execution Containers(一個現已進入預覽階段的全新沙箱系統)將 Windows 重新定位為原生的智能代理運行環境,並將其科學研究平台 Microsoft Discovery 轉為全面上市。
微軟在模型開發上的垂直整合,降低了其對 OpenAI 的依賴;雙方合作關係近期經過重組,以放寬兩家公司之間的聯繫。如果 MAI-Thinking-1 能夠兌現其基準測試的宣稱表現,可能推動企業級 AI 採購從第三方 API 供應商轉向微軟的 Azure 平台。無論最終哪個模型勝出,Nvidia——其 H100 和 B200 GPU 驅動著微軟大部分訓練基礎設施——都將持續受惠於資本支出的增長。微軟 Azure AI 營收在最近一季年增 157%,而自研模型可透過降低每 token 推理成本來改善利潤率。
本文僅供資訊參考,不構成投資建議。