Offchain Labs 將 AI 證明時間從 15 分鐘縮短至毫秒

Arbitrum 開發商 Offchain Labs 於 6 月 3 日發表研究論文，提出一種基於抽樣的方法，將 AI 推論證明的生成時間從約 15 分鐘縮短至毫秒。

「按 token 計價的模型創造了具體的欺詐經濟誘因——提供 70 億參數模型的成本低於 700 億參數模型，而運行量化推論也比全精度更便宜，」Offchain Labs 論文的作者在 2026 年 3 月題為《邁向可驗證 AI：輕量級密碼學推論證明》的研究中寫道。

現有的密碼學證明——類似於零知識 Rollup 所使用的類型——可以在無需重新執行的情況下證明正確的計算，但像 zkLLM 這樣的方案為一個 130 億參數模型生成單一推論證明大約需要 15 分鐘——這個時間框架與必須在一秒內回應的 API 不相容。Offchain Labs 的提案放棄了詳盡的重新執行，轉而採用隨機抽樣：伺服器先提交模型權重與內部值的數位指紋，然後客戶端選擇一條通往輸出的隨機路徑，要求伺服器僅揭露該路徑上的數值。如果伺服器替換了較小的模型，這些數值將不一致，驗證便會失敗，且重複查詢越多，被發現的機率就越高。

該協議將保護 Arbitrum One 的相同爭議解決邏輯——樂觀 Rollup 僅重新執行有爭議的步驟，而非每次計算——延伸至神經網路推論，採用二分法程序，在對數輪次內縮小兩台伺服器之間的分歧。對於新興的自動化代理市場以及需要模型治理的受監管行業而言，透明度聲明與可驗證聲明之間的差異正開始帶來直接的影響。

根據論文所述，史丹佛研究人員記錄到，GPT-3.5 與 GPT-4 在 2023 年 3 月至 6 月期間，在相同的評估任務上出現了可測量的行為變化。然而，目前的 API 合約並未提供任何機制來檢測這種差異。模型替換的經濟誘因會隨著交易量擴大：供應商可以將一部分查詢轉向較小或量化的模型，同時仍按較大模型的費用收費。

論文明確指出其與 Arbitrum 的關聯。樂觀 Rollup 基於相同的直覺運作——在每台機器上重新執行長計算的每一步成本高昂，而對有爭議的步驟進行抽樣則成本低廉。所提出的協議將該邏輯延伸至神經網路數值，採用與保護 Arbitrum One 相同的二分法爭議解決結構。

對於受監管行業、模型治理團隊以及新興的自動化代理市場而言，該協議不需要開發者修改現有技術堆疊；它只要求系統中的某個角色——無論是供應商、稽核員還是平台——產生一份可驗證的聲明。

本文僅供參考，不構成投資建議。