Offchain Labs 的新型基於抽樣的協議將 AI 推論驗證從 15 分鐘縮短至毫秒,解決了使用者無法確認 GPU 上實際運行的模型為何的信任缺口。
Offchain Labs 的新型基於抽樣的協議將 AI 推論驗證從 15 分鐘縮短至毫秒,解決了使用者無法確認 GPU 上實際運行的模型為何的信任缺口。

Arbitrum 開發商 Offchain Labs 於 6 月 3 日發表研究論文,提出一種基於抽樣的方法,將 AI 推論證明的生成時間從約 15 分鐘縮短至毫秒。
「按 token 計價的模型創造了具體的欺詐經濟誘因——提供 70 億參數模型的成本低於 700 億參數模型,而運行量化推論也比全精度更便宜,」Offchain Labs 論文的作者在 2026 年 3 月題為《邁向可驗證 AI:輕量級密碼學推論證明》的研究中寫道。
現有的密碼學證明——類似於零知識 Rollup 所使用的類型——可以在無需重新執行的情況下證明正確的計算,但像 zkLLM 這樣的方案為一個 130 億參數模型生成單一推論證明大約需要 15 分鐘——這個時間框架與必須在一秒內回應的 API 不相容。Offchain Labs 的提案放棄了詳盡的重新執行,轉而採用隨機抽樣:伺服器先提交模型權重與內部值的數位指紋,然後客戶端選擇一條通往輸出的隨機路徑,要求伺服器僅揭露該路徑上的數值。如果伺服器替換了較小的模型,這些數值將不一致,驗證便會失敗,且重複查詢越多,被發現的機率就越高。
該協議將保護 Arbitrum One 的相同爭議解決邏輯——樂觀 Rollup 僅重新執行有爭議的步驟,而非每次計算——延伸至神經網路推論,採用二分法程序,在對數輪次內縮小兩台伺服器之間的分歧。對於新興的自動化代理市場以及需要模型治理的受監管行業而言,透明度聲明與可驗證聲明之間的差異正開始帶來直接的影響。
根據論文所述,史丹佛研究人員記錄到,GPT-3.5 與 GPT-4 在 2023 年 3 月至 6 月期間,在相同的評估任務上出現了可測量的行為變化。然而,目前的 API 合約並未提供任何機制來檢測這種差異。模型替換的經濟誘因會隨著交易量擴大:供應商可以將一部分查詢轉向較小或量化的模型,同時仍按較大模型的費用收費。
論文明確指出其與 Arbitrum 的關聯。樂觀 Rollup 基於相同的直覺運作——在每台機器上重新執行長計算的每一步成本高昂,而對有爭議的步驟進行抽樣則成本低廉。所提出的協議將該邏輯延伸至神經網路數值,採用與保護 Arbitrum One 相同的二分法爭議解決結構。
對於受監管行業、模型治理團隊以及新興的自動化代理市場而言,該協議不需要開發者修改現有技術堆疊;它只要求系統中的某個角色——無論是供應商、稽核員還是平台——產生一份可驗證的聲明。
本文僅供參考,不構成投資建議。