0G與中國移動利用去中心化基礎設施成功訓練了一個1070億參數的AI模型,這是首次在無集中式數據中心的情況下完成超過千億參數的模型訓練。這項突破可能透過減少對超大規模GPU叢集的依賴,重塑電信運營商與企業進行大規模AI開發的方式。
0G與中國移動利用去中心化基礎設施成功訓練了一個1070億參數的AI模型,這是首次在無集中式數據中心的情況下完成超過千億參數的模型訓練。這項突破可能透過減少對超大規模GPU叢集的依賴,重塑電信運營商與企業進行大規模AI開發的方式。

0G攜手中國移動,利用去中心化基礎設施成功訓練了一個1070億參數的AI模型,標誌著這是首次在無集中式數據中心叢集的情況下開發超過千億參數的模型。
0G Labs共同創辦人Michael Heinrich表示:「達到此規模的去中心化訓練證明了大型模型開發不再需要獨佔超大規模GPU算力農場。擁有未充分利用計算能力的電信運營商,現在也能參與AI供應鏈。」
該模型採用0G的去中心化訓練框架,該框架整合了DiLoCoX方法。根據0G Labs的研究,此技術即使在頻寬僅有1GB的網路環境下,其訓練速度也能比先前的去中心化方法快上357倍。透過將計算負載分散至中國移動既有基礎設施而非單一數據中心,此專案繞過了傳統集中式GPU叢集的瓶頸——過去這項限制使得AI開發僅能由少數超大規模業者主導。
為何去中心化訓練對企業AI至關重要
這項成就直指AI產業的結構性問題:訓練大型模型需要對GPU叢集進行巨額前期資本支出,將除了最富裕的科技公司之外的其他參與者排除在外。去中心化訓練徹底翻轉了此模式,將任何連接網路的計算資源都視為潛在的訓練節點。對於像中國移動這樣在網路中擁有龐大但經常閒置計算基礎設施的電信運營商而言,這為其現有資產開創了新的收入來源。
此方法也降低了對輝達H100和B200 GPU的依賴,這些晶片正面臨供應限制與出口管制。透過聚合分散式網路中的異質計算資源,0G的框架能夠利用混合硬體類型來訓練模型,無需統一的GPU叢集。這可能為市值2000億美元的數據中心GPU市場緩解壓力——目前輝達最新晶片的交貨時間已延長至超過12個月。
然而,數據準備度仍是一大障礙。Gartner預估,到2026年為止,高達60%的AI專案可能因數據碎片化或孤立而遭到放棄,而這個問題並非去中心化訓練單獨能夠解決。希望採用此方法的企業必須先統一其數據基礎設施,才能受益於分散式計算。
對AI基礎設施架構的競爭格局影響
0G與中國移動的這項里程碑挑戰了由輝達與主要雲端運算供應商所主導的集中式訓練模式。若去中心化訓練獲得廣泛採用,可能使採購模式從超大規模GPU即服務方案,轉向一個更加分散的市場——電信運營商與邊緣運算提供商將能夠將其閒置產能變現。
Bittensor與Render Network這兩個將計算資源代幣化的項目,可能會隨著企業探索去中心化替代方案而迎來需求成長。此外,在分散式基礎設施上訓練模型的能力,也與歐盟及中國等地區日益嚴格的監管壓力相符——這些地區的數據主權要求使得集中式跨境訓練變得困難。
對投資人而言,此發展為AI基礎設施的投資論述引入了一個新變數。輝達的數據中心營收在其最近一個財年達到475億美元,其基礎建立在大型模型訓練需要集中式GPU叢集的假設之上。如果去中心化方法在規模上證實可行,集中式AI計算的整體可達市場規模可能縮小,從而有利於能夠匯集分散資源的基礎設施提供商。
本文僅供資訊參考,不構成投資建議。