IT之家 7 月 29 日消息,在今日晚间的理想 i8 发布会上,理想汽车宣布,理想 i8 全球首搭 VLA 司机大模型。
VLA 司机大模型将于 8 月随理想 i8 车型交付,同步升级至所有 AD Max 车型(Thor-U 平台与 Orin-X 平台)。
此外,对于其他辅助驾驶版本的理想车主,搭载 J6M 的 AD Pro 将在年底全量推送城市 NOA。
理想汽车介绍称,VLA 司机大模型拥有更强的思维能力,像人一样预判风险、认知世界、感知空间;更强的沟通能力,只用自然语言,就能顺畅交互;更强的记忆能力,记住用户的偏好和习惯。不仅路上可以开,小区地库、商场停车场一样可以开。
VLA 的实现是一个进化过程,经历了三个阶段:
第一阶段是 2021 年起自研的依赖规则算法和高精地图的辅助驾驶,类似“昆虫动物智能”。
第二阶段是 2023 年起研究,并于 2024 年正式推送的端到端 + VLM 辅助驾驶,接近“哺乳动物智能”。
第三阶段的 VLA 开启“人类智能”阶段,能通过 3D 和 2D 视觉的组合完整看到物理世界,且拥有完整的脑系统,具备语言、思维链推理能力,既能看,也能理解并真正执行行动。
VLA 司机大模型以“司机 Agent(智能体)”的产品形态呈现,用户可通过自然语言与司机 Agent 沟通,简单通用的短指令由端侧的 VLA 直接处理,复杂指令则先由云端的 VL 基座模型解析,再交由 VLA 处理。
理想汽车依托自有编译团队,自研底层推理引擎,使英伟达 Orin-X 芯片可通过 INT4 量化的方式运行 VLM,并且凭借芯片、控制器设计和自研汽车操作系统等综合能力,实现了让双 Orin-X 芯片和 Thor-U 芯片运行同等规模的 VLA 司机大模型。
也正因如此,所有理想汽车 Max 版车型,即便是 2022 款理想 L9 Max,均可升级到 VLA 司机大模型。
3 月 18 日,理想汽车在 NVIDIA GTC 2025 大会上推出了新一代自动驾驶技术 —— MindVLA 大模型。这个模型结合了视觉、语言和行为三大智能,号称开创了机器人大模型的新范式。用通俗易懂的语言来说,VLA 可以理解为看到、听到的同时也能做到(IT之家注:VLA 是指视觉-语言-动作 / 行为)。