AI 模型 API 的新型中間層市場正在興起,在中國每日 Token 調用量激增 1,000 倍並突破 140 萬億次的推動下,形成了一個人工智能的「批發轉零售」網絡。
AI 模型 API 的新型中間層市場正在興起,在中國每日 Token 調用量激增 1,000 倍並突破 140 萬億次的推動下,形成了一個人工智能的「批發轉零售」網絡。

AI 模型 API 的新型中間層市場正在興起,在中國每日 Token 調用量激增 1,000 倍並突破 140 萬億次的推動下,形成了一個人工智能的「批發轉零售」網絡。
人工智能的商業化正在催生一個新的中間人階層,即一個分發層,在這裡,機器智能的基本單位像商品一樣被購買、路由和轉售。這種「代幣經濟學(Tokenomics)」市場正受到中國每日 AI 模型 API 調用量爆炸式增長的推動。根據華源證券的研究報告,該調用量已從 2024 年初的 1,000 億次激增至 2026 年 3 月的超過 140 萬億次。這一新層級連接了上游模型廠商(如字節跳動和阿里巴巴)與碎片化的下游開發者及企業,為全球 AI Token 的流動創造了流動性基礎設施。
華源證券分析師陳亮東在報告中表示:「Token 運營正在形成一個新的中間層市場,即探索 Token 分銷模式,連接上游大模型廠商與下游開發者、企業和個人,本質是全球 Token 的批發到零售網絡的流動性基礎設施。」
這種增長受到 AI 消耗規模和中國模型競爭力不斷提升的推動。2026 年第一季度,中國模型在熱門路由平台 OpenRouter 上的周調用量首次超過了美國同類產品。在 2 月 16 日至 22 日期間,中國模型在調用量排名前五的模型中佔據了四席,貢獻了總量的 85.7%。像 OpenRouter(自 2025 年 10 月以來年化收入已增長五倍,突破 5,000 萬美元)以及國內的矽基流動(Silicon Mobility)等平台,正在構建這一貿易的核心基礎設施,提供統一的 API,允許開發者通過單一密鑰訪問數百種不同的模型。
這一新型 Token 經濟反映了從雲計算到加密支付等其他技術棧的演變,即基礎設施和分發最終會捕獲巨大價值。隨著 AI 競賽從資本密集型的模型訓練轉向為數十億用戶運行模型的運營挑戰(這一過程稱為「推理」),新的競爭護城河變成了單次回答的成本。MiniMax 的 M2.5 等中國模型的輸入成本僅為每百萬 Token 0.30 美元,而 Claude 4.6 等模型的成本為 5 美元。這種高效路由工作負載的經濟動機正在為這些新型 AI 經紀商創造價值數十億美元的機會。
Token 分銷業務不僅僅是加價轉售 API 訪問權限。雖然基礎轉售利潤(如 OpenRouter 的 5.5% 溢價)提供了基礎商業模式,但真正的價值是在技術棧的更上層創造的。最成熟的玩家正在開發專有的推理加速引擎,以降低運行模型的實際成本。例如,矽基流動聲稱其 SiliconLLM 和 OneDiff 技術可以將語言模型推理速度提高 10 倍,使其能夠以僅為行業標準成本十分之一的價格提供 API 調用。
隨著行業向「智能體 AI(Agentic AI)」邁進,對推理單位經濟效益的關注變得至關重要。根據高盛的研究,這種自主、常駐的系統可能比目前的 AI 工具耗能高出 60 到 130 倍。這些智能體將處理從企業工作流到管理智能設備的各種任務,從而驅動對 AI Token 的持續、公用事業般的消耗。能夠可靠且廉價地對這種消耗進行路由、計量和計費的平台,正將自己定位為 AI 經濟中不可或缺的公用事業。這與加密貨幣領域的基礎設施競爭如出一轍,Circle 和 Coinbase 等公司不僅在競爭發行穩定幣,還在構建控制其流動的支付和結算軌道(如 Arc 和 Base)。
對於投資者而言,這一 Token 分銷層的出現開辟了除了支持高知名度模型構建者之外的新途徑。華源證券的報告確定了兩個主要的投資邏輯:支持具備卓越模型能力的公司,如阿里巴巴、騰訊和字節跳動;以及支持擁有強大客戶關係和高消耗場景的公司,特別是在營銷、遊戲和電子商務領域。易點天下(yodo)和藍色光標(BlueFocus)等公司因其將基於 Token 的 AI 服務直接嵌入現有客戶工作流的潛力而受到關注。
然而,該模式並非沒有風險。基礎 API 轉售的技術門檻較低,這引發了激烈的競爭,可能會壓縮利潤空間。分銷商還面臨巨大的資金壓力,因為他們通常需要向模型提供商預購容量,同時向下游客戶提供更靈活的付款條件,從而產生壞帳風險。最重大的風險在於對上游模型提供商的依賴,後者控制著定價和准入。主要提供商的突然政策變化可能會瞬間瓦解分銷商的業務,使得這一領域雖然處於高速增長,但也極具波動性。
本文僅供參考,不構成投資建議。