Quyết định từ bỏ mô hình sử dụng AI không giới hạn cho sản phẩm Copilot Cowork dành cho doanh nghiệp của Microsoft đánh dấu một bước ngoặt: ngay cả công ty có giá trị lớn thứ hai thế giới cũng không thể hấp thụ chi phí token của AI tác nhân ở quy mô lớn.
Hôm thứ Ba, Microsoft đã chính thức phát hành Copilot Cowork với mô hình tính phí theo mức sử dụng, thay thế phương thức truy cập không giới hạn đã được áp dụng kể từ bản xem trước hồi tháng Ba. Tác nhân AI — có khả năng tự động thực hiện các tác vụ đa bước trên các tài liệu Microsoft 365 ngay cả khi máy tính của người dùng tắt — hiện tính phí khách hàng theo từng tín chỉ, với mỗi tín chỉ có giá 0,01 USD theo gói trả theo mức sử dụng. Giấy phép hàng tháng riêng biệt với giá 30 USD/người dùng cho Microsoft 365 Copilot vẫn là bắt buộc đối với các doanh nghiệp lớn.
"Một số người dùng hoàn thành hàng trăm tác vụ mỗi tuần, điều này rất hiệu quả — nhưng chi phí có thể leo thang rất nhanh," Charles Lamanna, phó chủ tịch điều hành mảng Copilot của Microsoft, cho biết.
Sự thay đổi về định giá này diễn ra cùng lúc với các báo cáo rằng Microsoft đang đánh giá phiên bản tự lưu trữ của mô hình nguồn mở DeepSeek V4 như một giải pháp thay thế chi phí thấp hơn cho các mô hình Anthropic và OpenAI hiện đang vận hành Copilot Cowork, theo Axios. Khách hàng hiện có thể chọn giữa Opus 4.8 và Sonnet 4.6 của Anthropic, trong khi những người tham gia chương trình Frontier có thể truy cập GPT 5.5 của OpenAI và mô hình Cowork 1 của riêng Microsoft. Việc bổ sung DeepSeek V4 sẽ mang lại cho Microsoft một lựa chọn nguồn mở được lưu trữ có thể giảm đáng kể chi phí token cho mỗi tác vụ — một động thái mà Axios đưa tin có thể được công bố trong vòng vài tuần tới.
Áp lực chi phí không chỉ riêng gì Microsoft. Chỉ số Token Dữ liệu Silicon, theo dõi giá token AI trên các nhà cung cấp lớn, đã giảm trong 12/13 phiên giao dịch gần đây, tiến gần đến mức thấp nhất trong ngắn hạn khi các nhà cung cấp cạnh tranh về giá và doanh nghiệp phản ứng trước hóa đơn ngày càng tăng. Mason Daugherty, một chuyên gia tư vấn AI doanh nghiệp, cho biết trong hầu hết mọi cuộc trò chuyện với khách hàng trong hai tháng qua, chi tiêu token trên toàn tổ chức đã nổi lên như một mối quan tâm hàng đầu. Ông dự đoán rằng "kinh tế token" sẽ trở thành chủ đề chi phối trong các cuộc thảo luận về mua sắm AI trong sáu đến 12 tháng tới, khi các hợp đồng doanh nghiệp hàng năm đến hạn gia hạn và các đội ngũ tài chính doanh nghiệp đặt câu hỏi liệu mức giá cao cấp cho các mô hình tiên tiến có còn hợp lý hay không.
Lợi thế Kiến trúc
Chiến trường cạnh tranh đang chuyển từ trí thông minh của mô hình sang định tuyến tiết kiệm chi phí. Arvind Jain, giám đốc điều hành của nền tảng AI doanh nghiệp Glean, cho biết nút thắt chính của AI doanh nghiệp không còn là khả năng của mô hình mà là "hiệu suất đầu ra token" — lượng công việc hữu ích mà mỗi token tiêu thụ tạo ra. Hầu hết chi phí AI, ông lưu ý, không đến từ bản thân câu lệnh mà từ cơ sở hạ tầng xung quanh: truy xuất, gọi công cụ, quản lý bộ nhớ và suy luận đa bước. Một yêu cầu đơn giản chỉ 11 từ có thể phình to thành hàng nghìn token sau khi hệ thống thu thập ngữ cảnh và xử lý các tác vụ một cách tuần tự.
"Trí thông minh tiên tiến đang trở nên dồi dào; thực thi hiệu quả thì không," Jain nói. "Lợi thế cạnh tranh thực sự đến từ các kiến trúc có thể ghép đúng mô hình và độ sâu suy luận với từng tác vụ — các hệ thống có khả năng định tuyến mạnh mẽ, kiểm soát chi phí và quản trị."
Chẩn đoán này phù hợp với chiến lược của Microsoft. Thay vì chỉ đơn giản thay thế một mô hình bằng một mô hình rẻ hơn, công ty đang xây dựng một cơ chế định tuyến mô hình có thể tự động gán nhiệm vụ cho lựa chọn tiết kiệm chi phí nhất — Anthropic cho suy luận phức tạp, DeepSeek hoặc mô hình của riêng Microsoft cho các truy vấn đơn giản hơn. Hệ thống thanh toán đã phân tách chi phí thành bốn thành phần: sử dụng mô hình, truy xuất ngữ cảnh, gọi công cụ và thời gian chạy, mang lại cho quản trị viên CNTT khả năng theo dõi chi tiết nơi chi tiêu tích lũy.
Khuôn khổ của Nadella: Vốn Token và Vốn Nhân lực
Giám đốc điều hành Microsoft Satya Nadella gần đây đã đưa ra một khuôn khổ rộng hơn nhằm đặt sự thay đổi này vào bối cảnh. Mọi công ty phải xây dựng thứ mà ông gọi là "vốn token" — các hệ thống và khả năng AI độc quyền của mình — song song với "vốn nhân lực," tri thức, mối quan hệ và khả năng phán đoán của lực lượng lao động. Ông lập luận rằng vốn nhân lực không mất giá trị khi vốn token tăng lên: "Nếu không có định hướng của con người, bạn chỉ đang quay tính toán tại chỗ."
Nadella cho biết thử nghiệm thực sự của chiến lược AI doanh nghiệp là liệu một công ty có thể thay thế mô hình nền tảng bên dưới mà không làm mất đi tri thức độc quyền và các khả năng đã tích lũy được hay không. "Đó là thử nghiệm cốt lõi về việc liệu bạn có duy trì được quyền kiểm soát và chủ quyền trong kỷ nguyên sắp tới hay không," ông nói.
Lời cảnh báo mang một sự căng thẳng ngầm: Nadella cảnh báo về việc để toàn bộ giá trị tập trung vào một số ít mô hình thống trị, so sánh điều này với cách toàn cầu hóa đã làm suy yếu các nền kinh tế công nghiệp. Tuy nhiên, chính công ty của ông đang đồng thời thắt chặt quan hệ với OpenAI và Anthropic trong khi khám phá một giải pháp thay thế nguồn mở của Trung Quốc — một hành động cân bằng phản ánh áp lực chi phí mà mọi người mua AI doanh nghiệp đang phải đối mặt.
Đối với các nhà đầu tư, hàm ý rất rõ ràng. Các nhà cung cấp API cao cấp như OpenAI và Anthropic phải đối mặt với việc thu hẹp biên lợi nhuận khi doanh nghiệp yêu cầu các giải pháp thay thế rẻ hơn, trong khi các nhà cung cấp mô hình nguồn mở như DeepSeek giành được đà tăng trưởng trong mua sắm. Các công ty xây dựng cơ sở hạ tầng định tuyến mô hình và tối ưu hóa chi phí — phần mềm trung gian nằm giữa người dùng và mô hình — có thể chiếm được giá trị không tương xứng khi kinh tế token trở thành tiêu chí mua sắm trung tâm. Cổ phiếu Microsoft đang giao dịch ở mức khoảng 30 lần thu nhập dự phóng; quá trình chuyển đổi Copilot Cowork có thể giúp công ty tiết kiệm hàng trăm triệu USD chi phí suy luận hàng năm nếu DeepSeek V4 được áp dụng, nhưng nó cũng báo hiệu rằng biên lợi nhuận AI doanh nghiệp trên toàn ngành đang thắt chặt nhanh hơn khả năng định giá của nhiều mô hình có thể chịu đựng.
Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.