小鹏世界模型进化出预测未来能力:将集成到第二代VLA中
5 小时前 / 阅读约2分钟
来源:凤凰网
小鹏集团发布技术论文X-Mind,详解世界模型预测未来能力集成到自驾模型中,展示其核心原理,包括思维草图、递归块扩散机制和思维链可视化,具备车规级芯片量产可行性。

凤凰网科技讯 6月29日,近日,小鹏集团再度发布技术论文X- Mind,详解如何将世界模型预测未来的能力集成到第二代VLA自驾模型中。不久前,在有“AI届奥斯卡”之称的CVPR大会,英伟达、特斯拉、小鹏集团同时受邀演讲,通用智能中心负责人刘先明再度披露小鹏物理AI的研发进展,首次对外展示世界模型技术图谱,拆解小鹏世界模型如何进化出预测未来、可控生成和长时序推演的能力。X-Mind作为小鹏世界模型重磅论文之一,让业界对纯视觉方案的大模型训练有了进一步的了解。

据了解,X-Mind的核心原理包括:思维草图——将未来12帧世界推演压缩至仅96个Token,保留道路拓扑、交通灯状态等核心语义,解决长上下文计算瓶颈;递归块扩散机制——在单次前向传播中生成高质量未来推演,推理延迟几乎持平;思维链可视化——展示模型在决策前对障碍物占位和车道连通性的预判。

对比实验数据显示,X-Mind在轨迹预测误差上较传统VLA模型显著降低,且推理延迟极低,具备车规级芯片量产可行性。该框架与X-World、X-Foresight共同组成小鹏物理AI基座模型研发谱系,实现主动思考、可控生成和长时序推演三大核心能力。