重點摘要:
- 小鵬汽車在CVPR 2026上發表X-Mind預測世界模型,用於自動駕駛
- 該框架採用三項技術:思維草圖、遞迴區塊擴散與視覺思維鏈
- 經過數億個駕駛影格訓練,使車輛能夠模擬未來場景
重點摘要:

小鵬汽車的X-Mind框架讓自動駕駛車輛在做出任何決策之前,就能先模擬未來交通場景。
小鵬汽車發表了X-Mind——一個能讓自動駕駛車輛透過內部推理模擬未來交通場景的預測世界模型,將自駕技術從被動反應轉變為主動決策。該框架於廣州舉行的CVPR 2026研討會「基礎模型在具身智能中的部署」上正式發表。
「X-Mind代表著從感知到行動系統,向預測智能的根本性轉變,」小鵬汽車集團通用智能中心負責人劉先明表示。「車輛現在可以在執行操作之前,透過內部模擬預測未來的交通變化。」
該框架融合了三項技術。「思維草圖」(Thought Sketch)創造了一種高效的認知表徵,結合鳥瞰圖布局與駕駛先驗知識,在保留道路結構、障礙物、交通號誌與導航意圖的同時,降低計算複雜度。「遞迴區塊擴散」(Recurrent Block Diffusion)能夠在單次前向傳遞中生成高品質的未來場景,克服傳統擴散方法需要多次迭代去噪步驟所導致的延遲問題——這對於高速公路速度下的即時駕駛決策而言是一項關鍵優勢。「視覺思維鏈」(Visual Chain-of-Thought)則揭示了模型在生成駕駛決策之前,如何預測障礙物移動、車道連通性與未來交通狀況,從而提升系統驗證的透明度。
X-Mind經過了數億個真實世界駕駛數據影格的訓練。小鵬汽車表示,該模型展現出更佳的軌跡預測準確度、在複雜長尾場景中的強化表現,以及適用於車規級晶片的超低推理延遲,不過該公司並未透露測試所用的具體硬體平台。
X-Mind與傳統自動駕駛架構的差異
大多數自動駕駛系統採用的是感知到行動的運作流程:攝影機與感測器偵測當前環境,系統再做出反應。特斯拉的全自動駕駛(FSD)、蔚來的NIO Pilot以及理想汽車的AD Max皆遵循此類方法的不同變體。X-Mind則增加了一個模擬層,在執行操作前先在內部運行多個未來場景,實際上賦予了車輛一種短期的預見能力。
「視覺思維鏈」元件使這項推理過程變得透明,清楚顯示模型考慮了哪些障礙物移動與車道變換。這項可解釋性功能可簡化那些要求安全監管機構提供決策邏輯證明的市場之驗證程序——隨著全球對自動駕駛系統的審查日益嚴格,這已成為一個日益受到關注的議題。
完成物理AI路線圖
X-Mind與X-World和X-Foresight共同補齊了小鵬汽車的物理AI基礎模型路線圖。這三個框架共同使車輛不僅能理解如何行動,還能理解每次行動後世界將如何變化。劉先明形容這項能力對於下一代自動駕駛至關重要——車輛必須能夠應對行人突然穿越或車輛無預警變換車道等不可預測的情境。
此次發表使小鵬汽車與特斯拉(其FSD V12系統採用端到端神經網路方法)以及中國競爭對手蔚來汽車和理想汽車形成競爭態勢,後兩者正競相在中國主要城市部署城市導航系統。小鵬汽車強調透過「視覺思維鏈」實現預測推理與可解釋決策,這可能使其在那些要求監管機構在批准自動駕駛功能前提供安全驗證證明的市場中佔據優勢。
投資角度
小鵬汽車在紐約證券交易所(代碼XPEV)和港交所(代碼9868)上市,其股價對自動駕駛技術里程碑相當敏感,投資人會權衡技術差異化與車輛交付量之間的關係。X-Mind框架若部署於量產車型,可望拉高平均售價,並鞏固小鵬汽車在競爭品牌超過50家的中國電動車市場中的地位。該公司並未提供X-Mind在其消費級車輛中量產部署的時間表。
本文僅供資訊參考,不構成投資建議。