Key Takeaways:
- 《財星》500大企業的每位員工AI成本已達每月7,500美元,引發大規模用量上限措施
- 微軟正探索DeepSeek V4,作為Anthropic旗艦模型成本57分之一的替代方案,用於Copilot Cowork
- 微軟、Databricks及Nvidia投資的Factory等公司推出的閘道工具,正成為AI成本管控的新基礎設施層
Key Takeaways:

《財星》500大企業內部無限AI代幣消耗的時代告終,取而代之的是嚴格的預算、用量上限以及對廉價模型的搶奪,因為每位員工的成本已達到每月7,500美元。
AT&T已限制員工存取微軟的GitHub Copilot。Meta收緊了對Anthropic及其他AI服務的支出。Uber在4月就用盡了整個2026年度的AI編碼預算,並將每位員工每項工具的上限設為每月1,500美元。Walmart對內部AI代理設定了限制。亞馬遜則廢除了根據AI使用量對員工進行排名的內部排行榜——原因是發現員工為了提升排名而大量消耗算力。
據知情人士透露,從「tokenmaxxing」(最大化AI代幣消耗)轉向「tokenminimizing」(最小化代幣消耗)的趨勢,正在生成式AI的最大企業用戶中全面蔓延。根據《The Information》報導,在AI使用最密集的公司,每位員工每月AI成本已達到7,500美元,這一數字迫使財務長們不得不介入干預。
「企業正在意識到,代理型AI工作流程在固定費率定價下無法擴展,」Edgen的企業AI分析師Alex Nguyen表示。「當一個AI代理可以串聯50次模型調用來完成一項任務時,這個數學模型在企業規模下就會崩潰。」
每位員工7,500美元的數學問題
這種結構性轉變源於代理型AI工具的興起——這類軟體能自主串聯多次模型調用,在電子郵件、試算表和即時通訊應用中完成複雜任務。與手動聊天機器人查詢不同,這些代理會以難以預測或限制的方式爆發式消耗代幣。
根據微軟內部審查的數據,該公司發現部分工程師僅使用Claude Code每月就要花費500到2,000美元的代幣費用。企業AI互動成本自2023年以來已飆升30倍,高盛預測代理型工作流程可能使代幣需求較當前水準增加24倍。
高端模型與開源模型之間的價格差距使這一矛盾更加尖銳。Anthropic最新旗艦模型的成本約為每百萬代幣50美元,而DeepSeek V4 Pro的運行成本約為每百萬代幣0.87美元——根據兩家公司公布的定價數據,兩者相差57倍。Axios於6月16日報導,微軟正在探索使用經過微調且自託管的DeepSeek V4版本,作為其Copilot Cowork產品的低成本後端。
並非每家公司都在收緊。Databricks的工程負責人Nikita Shamgunov上週在Nebius的一場活動中表示,該公司對工程師不設AI預算上限。Box執行長Aaron Levie則表示,他的公司從一開始就從未採行tokenmaxxing。「我們沒有排行榜,所以我們沒有走偏,」Levie說。
新AI預算時代的守門人
成本管控浪潮正在創造新的基礎設施需求。微軟和Databricks各自推出了「閘道」工具,用於監控員工AI使用情況並執行支出上限。由Nvidia投資、估值15億美元的Factory本月發布了一個模型路由器,可自動將低複雜度任務分配給較便宜的模型。
Palantir和Box的高層表示,企業客戶對將簡單任務從昂貴的前沿模型轉移到更便宜或開源替代方案的需求正在增長。這種模式類似於十年前從全高端雲端運算轉向分層雲端運算的趨勢,那次轉變重塑了公有雲市場。
微軟執行長Satya Nadella將此趨勢視為戰略必要。「我們沒有人希望看到一個世界,每個行業的每家公司都將價值拱手讓給少數『贏家通吃』的模型,」他上週在X平台寫道。這番言論分量十足,因為微軟自身的生產力軟體目前在定價上正與Anthropic和OpenAI競爭。
微軟於6月16日正式上市的Copilot Cowork新產品,體現了這種矛盾。該產品需要每月每位用戶30美元的Microsoft 365 Copilot授權費,再加上透過Copilot Credits按使用量計費的額外費用——這種雙重訂閱加消耗量模式與Anthropic的企業定價如出一轍。微軟執行副總裁Charles Lamanna表示,客戶「可以選擇如何管理成本」,包括設定每位員工的使用上限,以及將Anthropic模型替換為OpenAI或微軟自身的替代方案。
投資者面臨的問題是,成本控制是否會削弱當初支撐企業AI支出的生產力成長。微軟股價目前為預期本益比33倍,AI相關營收成長是看多論點的關鍵支柱。如果代幣限縮減緩了採用速度,那麼當前估值中所隱含的營收預測可能過於樂觀。就目前而言,財務長們佔了上風。
本文僅供資訊參考之用,不構成投資建議。