Microsoft đã công bố bảy mô hình AI độc quyền tại Build 2026, bao gồm mô hình suy luận đầu tiên, báo hiệu bước chuyển chiến lược từ phụ thuộc vào OpenAI sang tự chủ trong lĩnh vực trí tuệ nhân tạo.
Mô hình suy luận MAI-Thinking-1 của Microsoft với 35 tỷ tham số hoạt động và cửa sổ ngữ cảnh 128.000 token trực tiếp cạnh tranh với Claude của Anthropic và Gemini của Google, đe dọa định hình lại thị trường mô hình AI trị giá hơn 200 tỷ USD.
"Mọi công ty nên chuyển từ tiêu thụ mô hình tiên tiến sang tham gia đầy đủ vào tiên phong," Giám đốc điều hành Microsoft Satya Nadella phát biểu trên sân khấu Build tại San Francisco.
Theo Microsoft, mô hình này được huấn luyện mà không sử dụng phương pháp chưng cất từ hệ thống bên thứ ba, đạt ngang bằng với các đối thủ cạnh tranh hàng đầu trên các tiêu chuẩn kỹ thuật phần mềm chính. Công ty cũng phát hành MAI-Code-1-Flash, mô hình lập trình 5 tỷ tham số tích hợp vào GitHub Copilot và Visual Studio Code, cùng với các mô hình tạo hình ảnh, phiên âm và giọng nói, tổng cộng bảy sản phẩm.
Động thái này làm giảm sự phụ thuộc của Microsoft vào OpenAI — nơi họ đã đầu tư 13 tỷ USD — và Anthropic — nơi họ nắm giữ 5 tỷ USD cổ phần. Microsoft hiện có thể chạy suy luận trên hạ tầng Azure của riêng mình, thu về biên lợi nhuận trước đây phải trả cho các nhà cung cấp mô hình bên thứ ba. Cổ phiếu hiện đang giao dịch ở mức khoảng 30 lần thu nhập dự phóng.
Bộ sưu tập mô hình và định vị cạnh tranh
MAI-Thinking-1 được thiết kế cho các hướng dẫn phức tạp nhiều bước, suy luận ngữ cảnh dài và tạo mã lệnh, đặt nó vào vị trí cạnh tranh trực tiếp với Anthropic Claude Sonnet 4.6 và Google Gemini 3.5 Flash. Theo Mustafa Suleyman, giám đốc điều hành Microsoft AI, Microsoft cho biết mô hình này vượt trội hơn GPT-5-5 của OpenAI về hiệu quả chi phí lên tới 10 lần khi được tinh chỉnh cho quy trình tư vấn của McKinsey.
Mô hình lập trình, MAI-Code-1-Flash, chạy ở mức 5 tỷ tham số và được Kyle Daigle, giám đốc tiếp thị nhà phát triển kiêm giám đốc vận hành GitHub của Microsoft, mô tả là "siêu hiệu quả suy luận." Mô hình này có sẵn ngay lập tức trong GitHub Copilot và Visual Studio Code, cung cấp cho bộ công cụ nhà phát triển của Microsoft một động cơ độc quyền thay vì phụ thuộc vào các nhà cung cấp mô hình bên ngoài.
Về mặt đa phương thức, MAI-Image-2.5 và biến thể Flash hỗ trợ tạo hình ảnh từ văn bản và chỉnh sửa ảnh, với Microsoft tuyên bố điểm Arena vượt trội so với mô hình hình ảnh của Anthropic. MAI-Transcribe-1.5 xử lý âm thanh nhanh hơn năm lần so với các hệ thống cạnh tranh, trong khi MAI-Voice-2 bổ sung thêm 15 ngôn ngữ và các tùy chọn giọng nói mới.
Vượt ra ngoài mô hình: Tác nhân, Phần cứng và Công cụ phát triển
Microsoft cũng giới thiệu Scout, một tác nhân AI doanh nghiệp được xây dựng trên khung OpenClaw và được nhúng trực tiếp vào các ứng dụng Microsoft 365 bao gồm Outlook, Teams và OneDrive. Scout có thể tự động hóa quản lý email, sắp xếp lịch, báo cáo chi phí và theo dõi tác vụ, hoạt động như một trợ lý thường trực cho doanh nghiệp.
Công ty đã giải quyết các vấn đề bảo mật xung quanh tác nhân tự động bằng Microsoft Execution Containers, một hộp cát ở cấp hệ điều hành giới hạn những gì tác nhân AI có thể truy cập trên thiết bị Windows. Trong một buổi trình diễn trực tiếp, Microsoft cho thấy ngay cả khi các lớp bảo mật của riêng OpenClaw bị vô hiệu hóa, MXC vẫn ngăn tác nhân xóa tệp trên desktop — một kịch bản mà theo công ty, sẽ thành công sáu tháng trước.
Dành cho các nhà phát triển xây dựng ứng dụng AI cục bộ, Microsoft đã công bố Surface RTX Spark Dev Box, một máy trạm nhỏ gọn được trang bị chip RTX Spark của Nvidia với 128 gigabyte bộ nhớ hợp nhất và 1 PFLOP sức mạnh tính toán AI. Thiết bị có thể chạy các mô hình lên tới 120 tỷ tham số cục bộ và hỗ trợ cửa sổ ngữ cảnh 1 triệu token, nhắm đến các nhà phát triển cần tạo nguyên mẫu và thử nghiệm tác nhân AI mà không phải trả chi phí đám mây.
Về mặt phần mềm, Microsoft đã phát hành Coreutils cho Windows, mang hơn 75 tiện ích dòng lệnh Linux — được viết lại bằng Rust — lên terminal gốc của Windows. Công ty cũng hé lộ WSL Containers để quản lý container Linux gốc và một Intelligent Terminal có thể đọc lỗi, phân tích nguyên nhân và thực thi các bản sửa lỗi đa bước một cách tự động.
Hàm ý dành cho nhà đầu tư
Danh mục mô hình của Microsoft tạo ra cả cơ hội và rủi ro. Công ty hiện có thể cung cấp cho các nhà phát triển suy luận chi phí thấp hơn thông qua các mô hình của riêng mình chạy trên Azure, có khả năng thu hẹp biên lợi nhuận của OpenAI và Anthropic đồng thời mở rộng doanh thu AI của chính Microsoft. Nvidia sẽ được hưởng lợi từ quan hệ đối tác Surface Dev Box, đưa chip RTX Spark của hãng vào hệ sinh thái phần cứng của Microsoft.
Câu hỏi lớn hơn là liệu việc Microsoft tham gia muộn vào các mô hình độc quyền có thể giành được chỗ đứng so với các nhà lãnh đạo đã có tên tuổi hay không. OpenAI và Anthropic đều đang tiến hành phát hành cổ phiếu lần đầu ra công chúng trong năm nay, với Anthropic đã nộp hồ sơ bảo mật cho đợt IPO vào tháng Sáu. Lợi thế của Microsoft nằm ở khả năng phân phối: GitHub có hơn 100 triệu nhà phát triển, Windows chạy trên hơn 1 tỷ thiết bị và Microsoft 365 phục vụ hàng trăm triệu người dùng doanh nghiệp. Mỗi kênh hiện đang mang động cơ AI của riêng Microsoft thay vì mô hình của bên thứ ba.
Bài viết này chỉ mang tính chất tham khảo và không cấu thành lời khuyên đầu tư.