中國AI模型正逐步搶佔推理路由流量,其API成本僅為美國競爭對手的零頭,正在重塑AI市場的經濟格局。
中國AI模型正逐步搶佔推理路由流量,其API成本僅為美國競爭對手的零頭,正在重塑AI市場的經濟格局。

中國AI模型正逐步搶佔推理路由流量,其API成本僅為美國競爭對手的零頭,正在重塑AI市場的經濟格局。
來自DeepSeek、阿里巴巴通義千問(Qwen)及字節跳動的中國AI模型,正贏得越來越多的模型路由查詢份額。開發者將非敏感工作負載轉向最便宜的推理提供商,這對OpenAI、Anthropic和Google的定價能力構成威脅。
這一趨勢在6月8日CNBC記者Deirdre Bosa的報導中被重點關注。該報導探討了隨著成本差距在整個行業擴大,模型路由平台如何將越來越多的流量導向中國供應商。
DeepSeek V3模型的API定價約為每百萬輸入token 0.14美元,而OpenAI GPT-4o則為2.50美元——折扣幅度達94%。阿里巴巴的Qwen 2.5和字節跳動的豆包模型也提供類似的定價優勢,這使它們成為那些以成本優化為優先、而非單純追求頂尖能力的路由平台的默認選擇。
這一轉變威脅到美國AI龍頭企業的商業模式,這些企業一直依賴高溢價API定價來建立業務。僅OpenAI一家今年的預期營收就超過100億美元,其中大部分來自API訪問。如果路由平台繼續將流量導向中國供應商,美國公司可能被迫降價,從而壓縮整個行業的利潤率。
模型路由如何重塑推理市場
OpenRouter和Together AI等模型路由平台會自動評估傳入查詢,並將其導向在能力與成本之間提供最佳平衡的模型。對於摘要生成、翻譯和基礎程式碼生成等任務——這些佔據了推理流量的大多數——中國模型通常以極低的價格提供可比的品質。這為中國供應商創造了結構性優勢,而美國實驗室若不大幅降價,很難輕易反制。
誰贏誰輸
最大的受益者是支持多模型路由的雲端基礎設施提供商,包括AWS、Google Cloud和阿里雲。無論哪個模型最終勝出路由決策,它們都能賺取運算收入。Nvidia也因整體運算需求的增長而受益——每一次推理查詢仍需要GPU算力,而路由平台則推動了更高的整體利用率。
最大的輸家則是那些在訓練前沿模型上投入數十億美元、如今卻面臨一場可能難以取勝的價格戰的美國AI實驗室。OpenAI已籌集超過200億美元資金,其中大部分用於訓練算力和人才。如果路由平台將推理商品化,那麼支撐這些投資的經濟邏輯將開始瓦解。
對投資者而言,關鍵問題在於美國AI公司能否維持其定價能力。OpenAI、Anthropic和Google DeepMind一直依賴高溢價API定價來資助大規模訓練計劃。DeepSeek的V3模型訓練成本僅約600萬美元的算力支出,而美國同級模型的投入則高達數億美元——這種成本結構使中國供應商能夠無限期中壓低美國的定價。摩根士丹利分析師已將推理定價標記為AI基礎設施估值的一個關鍵風險,指出持續的價格戰可能會降低截至2027年計劃投入的2000億美元AI數據中心資本支出的預期回報。
本文僅供參考,不構成投資建議。