核心要点:
- 小鹏汽车在CVPR 2026上发布了用于自动驾驶的预测世界模型X-Mind
- 该框架运用三项技术:思维草图、循环块扩散和视觉思维链
- 基于数亿帧驾驶数据训练,使车辆能够模拟未来场景
核心要点:

小鹏汽车的X-Mind框架让自动驾驶车辆在做出任何决策之前,就能模拟未来的交通场景。
小鹏汽车发布了X-Mind,这是一个预测世界模型,使自动驾驶车辆能够通过内部推理模拟未来交通场景,将自动驾驶从被动反应转变为主动决策。该框架于2026年6月29日在广州举办的CVPR 2026研讨会"具身智能基础模型部署"专题工作坊上正式亮相。
"X-Mind代表了一种从感知-行动系统向预测智能的根本性转变,"小鹏集团通用智能中心负责人刘先明表示,"车辆现在可以在执行操作之前,通过内部模拟来预判未来的交通变化。"
该框架融合了三项核心技术。思维草图(Thought Sketch) 创建了一种高效的认知表征,结合了鸟瞰布局和驾驶先验知识,保留了道路结构、障碍物、交通信号灯和导航意图,同时大幅降低了计算复杂度。循环块扩散(Recurrent Block Diffusion) 能够在单次前向传播中生成高质量的未来场景,克服了传统扩散方法需要多次迭代去噪带来的延迟挑战——这对于高速行驶中的实时驾驶决策来说是一个关键优势。视觉思维链(Visual Chain-of-Thought) 则揭示了模型在生成驾驶决策之前是如何预测障碍物运动、车道连通性和未来交通状况的,从而提高了系统验证的透明度。
X-Mind基于数亿帧真实世界驾驶数据训练而成。小鹏汽车表示,该模型在轨迹预测准确性、复杂长尾场景下的性能表现以及适用于车规级芯片的超低推理延迟方面均有显著提升,但未透露测试所用的具体硬件平台。
X-Mind与传统自动驾驶架构的区别
大多数自动驾驶系统采用感知到行动的流水线模式:摄像头和传感器检测当前环境,系统做出反应。特斯拉的完全自动驾驶(FSD)、蔚来的NIO Pilot以及理想汽车的AD Max均遵循此类方法的变体。X-Mind增加了一个模拟层,在执行操作前先在内部运行多个未来场景,从而赋予车辆一种短期的预见能力。
视觉思维链组件使这一推理过程变得透明,清晰展示模型考虑了哪些障碍物运动和车道变更。这一可解释性功能可以简化那些需要安全监管部门验证决策逻辑的市场审批流程——随着自动驾驶系统在全球范围内面临日益严格的审查,这一点正变得越来越重要。
完成物理AI路线图的最后一块拼图
X-Mind与X-World和X-Foresight共同构成了小鹏汽车物理AI基础模型路线图的完整体系。这三个框架共同使车辆不仅理解如何行动,还能理解每次行动后世界将如何演变。刘先明将这一能力描述为下一代自动驾驶的关键所在,因为车辆需要应对诸如行人突然横穿马路或车辆不打转向灯并线等不可预测的场景。
这一发布使小鹏汽车与特斯拉展开正面竞争——特斯拉已通过FSD V12系统走上了端到端神经网络路线——同时也直面蔚来和理想汽车等中国竞争对手,后者正竞相在中国主要城市部署城市导航系统。小鹏汽车强调通过视觉思维链实现预测推理和可解释决策,这或使其在那些要求监管机构在批准自动驾驶功能前提供安全验证证明的市场中占据优势。
投资视角
在纽交所(代码:XPEV)和港交所(代码:9868)上市的小鹏汽车,其股价一直对自动驾驶技术里程碑事件高度敏感,因为投资者会在技术差异化与车辆交付量之间进行权衡。X-Mind框架如果搭载于量产车型,有望支持更高的平均售价,并巩固小鹏汽车在中国竞争超过50个品牌的电动汽车市场中的地位。该公司尚未透露X-Mind在其量产车型中的部署时间表。
本文仅供信息参考,不构成投资建议。