Kỷ nguyên tiêu thụ token AI không giới hạn bên trong các công ty Fortune 500 đã kết thúc, nhường chỗ cho ngân sách thắt chặt, trần sử dụng và cuộc chạy đua tìm kiếm mô hình rẻ hơn khi chi phí bình quân mỗi nhân viên chạm 7.500 USD/tháng.
AT&T đã hạn chế quyền truy cập của nhân viên vào GitHub Copilot của Microsoft. Meta thắt chặt chi tiêu cho Anthropic và các dịch vụ AI khác. Uber đã cạn kiệt toàn bộ ngân sách lập trình AI năm 2026 ngay từ tháng 4 và giới hạn mỗi nhân viên ở mức 1.500 USD/công cụ/tháng. Walmart đặt ra các giới hạn đối với AI agent nội bộ. Amazon đã xóa bỏ bảng xếp hạng nội bộ từng phân hạng nhân viên theo mức độ sử dụng AI — sau khi phát hiện nhân viên đốt tài nguyên tính toán chỉ để leo hạng.
Sự đảo chiều từ "tokenmaxxing" — thói quen tối đa hóa tiêu thụ token AI — sang "tokenminimizing" đang lan rộng khắp các tập đoàn sử dụng AI tạo sinh lớn nhất, theo những người am hiểu sự việc. Tại những công ty sử dụng AI nhiều nhất, chi phí AI hàng tháng bình quân mỗi nhân viên đã lên tới 7.500 USD, The Information đưa tin, một con số buộc các giám đốc tài chính phải can thiệp.
"Các công ty đang nhận ra rằng quy trình AI agent không thể mở rộng dưới mô hình định giá phẳng," Alex Nguyen, chuyên gia phân tích AI doanh nghiệp tại Edgen, cho biết. "Khi một AI agent duy nhất có thể xâu chuỗi 50 lượt gọi mô hình để hoàn thành một tác vụ, phép tính sẽ vỡ ở quy mô doanh nghiệp."
Bài toán 7.500 USD mỗi nhân viên
Sự thay đổi cấu trúc bắt nguồn từ sự trỗi dậy của các công cụ AI agent — phần mềm tự động xâu chuỗi nhiều lượt gọi mô hình để hoàn thành các tác vụ phức tạp xuyên suốt email, bảng tính và ứng dụng nhắn tin. Không giống như các truy vấn chatbot thủ công, các agent này tiêu thụ token theo từng đợt bùng nổ khó dự đoán hoặc kiểm soát.
Microsoft phát hiện ra rằng một số kỹ sư đang chi từ 500 đến 2.000 USD/tháng chỉ riêng cho phí token từ Claude Code, theo dữ liệu nội bộ mà công ty xem xét. Chi phí tương tác AI doanh nghiệp đã tăng gấp 30 lần kể từ năm 2023, và Goldman Sachs dự báo quy trình agentic có thể đẩy nhu cầu token tăng gấp 24 lần so với mức hiện tại.
Khoảng cách giá giữa các mô hình cao cấp và mã nguồn mở khiến căng thẳng thêm gay gắt. Mô hình hàng đầu mới nhất của Anthropic có giá khoảng 50 USD/triệu token, trong khi DeepSeek V4 Pro chạy ở mức khoảng 0,87 USD/triệu token — chênh lệch gấp 57 lần, theo dữ liệu định giá do cả hai công ty công bố. Microsoft hiện đang khám phá một phiên bản DeepSeek V4 được tinh chỉnh và tự lưu trữ làm backend chi phí thấp hơn cho sản phẩm Copilot Cowork, Axios đưa tin ngày 16/6.
Không phải công ty nào cũng thắt chặt. Databricks không áp đặt trần ngân sách AI nào lên các kỹ sư của mình, lãnh đạo mảng kỹ thuật Nikita Shamgunov phát biểu tại một sự kiện của Nebius tuần trước. Giám đốc điều hành Box Aaron Levie cho biết công ty của ông chưa bao giờ áp dụng tokenmaxxng ngay từ đầu. "Chúng tôi không có bảng xếp hạng, vì vậy chúng tôi không đi lạc đường," Levie nói.
Những người gác cổng của kỷ nguyên ngân sách AI mới
Làn sóng kiểm soát chi phí đang tạo ra một tầng nhu cầu hạ tầng mới. Microsoft và Databricks đều đã ra mắt các công cụ "gateway" nhằm giám sát việc sử dụng AI của nhân viên và thực thi các giới hạn chi tiêu. Factory — công ty được hậu thuẫn bởi Nvidia, định giá 1,5 tỷ USD — đã phát hành một bộ định tuyến mô hình trong tháng này, tự động gán các tác vụ có độ phức tạp thấp cho các mô hình rẻ hơn.
Các lãnh đạo Palantir và Box báo cáo nhu cầu ngày càng tăng từ các khách hàng doanh nghiệp muốn chuyển các tác vụ đơn giản từ các mô hình tiên tiến đắt đỏ sang các giải pháp thay thế rẻ hơn hoặc mã nguồn mở. Mô hình này phản ánh sự chuyển dịch từ điện toán đám mây cao cấp sang phân tầng đã tái định hình thị trường đám mây công cộng một thập kỷ trước.
Giám đốc điều hành Microsoft Satya Nadella coi xu hướng này là một tất yếu chiến lược. "Không ai trong chúng ta muốn thấy một thế giới nơi mọi công ty trong mọi ngành nghề nhường giá trị cho một số ít mô hình 'kẻ thắng lấy hết'," ông viết trên X tuần trước. Bình luận này có sức nặng đáng kể khi bản thân phần mềm năng suất của Microsoft hiện cạnh tranh với Anthropic và OpenAI về giá cả.
Sản phẩm Copilot Cowork mới của Microsoft, được phát hành rộng rãi vào ngày 16/6, thể hiện rõ sự căng thẳng này. Sản phẩm yêu cầu giấy phép Microsoft 365 Copilot với giá 30 USD/người dùng/tháng cộng với phí sử dụng bổ sung thông qua Copilot Credits — mô hình kết hợp đăng ký cộng tiêu thụ tương tự định giá doanh nghiệp của Anthropic. Phó Chủ tịch điều hành Microsoft Charles Lamanna cho biết khách hàng "có thể chọn cách quản lý chi phí," bao gồm đặt giới hạn sử dụng theo nhân viên và hoán đổi mô hình Anthropic lấy OpenAI hoặc các giải pháp thay thế của riêng Microsoft.
Câu hỏi dành cho các nhà đầu tư là liệu các biện pháp kiểm soát chi phí có làm giảm bớt mức tăng năng suất vốn là lý do biện minh cho chi tiêu AI doanh nghiệp hay không. Cổ phiếu Microsoft đang giao dịch ở mức 33 lần thu nhập dự phóng, với doanh thu liên quan đến AI là trụ cột chính của luận điểm tăng trưởng. Nếu việc bóp nghẹt token làm chậm tốc độ áp dụng, các dự báo doanh thu được xây dựng trong định giá hiện tại có thể trở nên quá lạc quan. Hiện tại, các CFO đang chiếm thế thượng phong.
Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.