黄仁勋发布Alpamayo 2 Super：自动驾驶黑箱终于被打开了 - 智能汽车

Just Quick Just Quality

热门话题

白天

搜索

资讯

黄仁勋发布Alpamayo 2 Super：自动驾驶黑箱终于被打开了

2026-06-02 / 阅读约10分钟

来源：36kr

英伟达在GTC台北2026大会发布Vera CPU、DSX平台、RTX Spark超级芯片等产品，推出开放推理模型NVIDIA Alpamayo 2 Super，还介绍了AlpaGym、OmniDreams等辅助工具，构建完整“智能体经济”基础设施版图。

“Alpamayo标志着汽车从‘单纯驾驶’迈入‘安全推理’时代。”

黄仁勋在英伟达GTC台北2026大会现场这样说道。

在近两个小时的演讲中，他不仅发布了专为智能体设计的Vera CPU、AI工厂实战指南DSX平台、RTX Spark超级芯片等产品，更在汽车行业最为关注的自动驾驶领域推出了开放推理模型——NVIDIA Alpamayo 2 Super。

这是一个320亿参数的开放视觉-语言-动作推理模型（Reasoning VLA），能够在完整驾驶堆栈中进行推理、规划与行动，从而为更安全、可规模化的 L4 级自动驾驶开发提供支持。

当然，这不是一次简单的模型升级，而是一场从“模仿驾驶”到“安全推理”的根本范式转移。

大会上，黄仁勋发布的产品从底层芯片到上层基础设施，从数据中心到个人PC，从云端智能到物理机器人，标志着英伟达正在经历从"GPU供应商"向"AI基础设施运营商"的根本性转变。

Alphamale 2：自动驾驶迈入推理新阶段

Alpamayo 2的核心突破在于"可解释性"。

传统端到端自动驾驶模型如同一个沉默的老司机，人们无法知道其决策过程。但Alpamayo 2则像一个"话痨司机"，车辆可以用自然语言实时解释每一步决策，例如"由于前方静止车辆阻挡车道，向左微调"、"为左侧切入车辆让行"、"停车让行穿越交通"。这种"思维链"外化能力，显然更有利于获得人们的信任。

技术规格上，Alpamayo2实现了三项关键升级：360度全景感知（从前摄像头扩展至前、侧、后方），为变道、并线和交叉路口通行提供完整场景信息；新增"元动作（Meta-Action）"输出，包括让行、变道和停车等宏观决策，使模型能够为下游规划提供高级驾驶指令；以及具有2D定位的推理自动标注，将标注周期从数月压缩至数天，重塑辅助驾驶数据管线的成本结构。

更值得关注的是其"教师-学生"蒸馏架构。320亿参数的Alpamayo2 Super作为教师模型，可被蒸馏为紧凑型模型，运行在NVIDIA DRIVE AGX Thor车载计算平台上。这意味着车企无需从零构建大模型，就能通过英伟达的开放生态获得"即插即用"的推理能力。

自发布以来，Alphamayo系列下载量已接近40万次，并荣获COMPUTEX Best Choice Award车辆技术和智能座舱类别奖。

黄仁勋对大模型的评价是："Alphamayo标志着汽车从'单纯驾驶'迈入'安全推理'。只有英伟达能够提供开放模型、仿真环境、现实世界数据以及智能体技能，支持全球无人驾驶出租车生态系统开发出理解边缘场景、解释自身决策、赢得公众信任，并安全地规模化部署到数百万台车上的L4级能力。"

"虚拟驾校"：AlpaGym与OmniDreams

如果说Alphamale 2是"会思考的司机"，那么英伟达同步推出的AlpaGym和OmniDreams就是它的"虚拟驾校"。

具体来看，AlpaGym是一个开源、高吞吐量的闭环强化学习框架。与传统开环训练"根据记录数据评估模型并生成单轮动作"不同，AlpaGym让模型在NVIDIA AlpaSim仿真环境中经历连续的决策-观察循环——每次刹车、转向和导航选择都会对环境产生真实影响，从而暴露出静态数据集所忽略的复合错误和边缘故障。这相当于让AI司机在"平行宇宙"中经历数百万次极端路况，把犯错成本降到零。

OmniDreams则是全新的生成式世界模型，能够生成逼真的闭环辅助驾驶场景，支持开发者大规模仿真罕见的长尾驾驶场景。结合NVIDIA Omniverse NuRec神经重建技术，开发者可以将真实车队数据重建为逼真的3D场景，并适配不同车辆传感器配置。英伟达甚至将因果链自动标注流水线以开源形式发布在GitHub上，能够从原始驾驶片段中自动生成基于决策的因果链标签，无需人工标注。

这套"仿真-训练-部署"闭环的意义在于：它让自动驾驶开发从"路测驱动"转向"仿真驱动"。车企不再需要投入数千台测试车在真实道路上积累十万公里数据，而是可以在数字孪生环境中完成90%以上的边缘案例验证，可以帮助车企降低研发成本、缩短上市周期。

“超级大脑"：Vera Rubin与Vera CPU

大会上，黄仁勋还回顾了Vera Rubin。

黄仁勋表示，作为全球首款专为智能体AI设计的多机架Pod级超级计算系统，Vera Rubin已进入全面量产。

Vera Rubin将"推理"与"工具调用"的延迟压到了纳秒级敏感水平——这正是智能体决策所需的实时性基础，其中最具颠覆性的组件是专为智能体设计的Vera CPU。

黄仁勋这样介绍这款CPU："AI智能体将成为计算资源的最大用户。Vera正是为这一未来量身打造的首款CPU——它具备卓越的性能、能效和可编程性，专为在超大规模下运行智能体AI而生。"

Vera CPU搭载了88颗Olympus核心，采用空间多线程技术，配备带宽高达1.2TB/s的LPDDR5X内存子系统。它的设计哲学与传统CPU截然不同：传统CPU为人类设计，人类对秒级延迟不敏感；智能体对延迟极度敏感，需要纳秒级响应，因此需要从头设计全新的CPU架构。

这款处理器的性能数据自然非常不错——Vera CPU在SQL查询速度上比顶级x86快3倍，在纽交所实时流处理性能上快6倍，在智能体沙箱性能上达到x86的1.8倍。它通过第二代NVLink-C2C互连技术，实现CPU与GPU之间高达1.8TB/s的相干带宽，并将英伟达机密计算扩展至整机架规模。

Vera BlueField-4 STX处理器更将Vera CPU与高性能网络、存储加速及芯片级安全融为一体，构建"设计即安全"的AI原生数据平台。

DSX：AI工厂制造蓝图

如何将这些硬件转化为客户的实际收益？英伟达的答案是DSX——一套建设AI工厂的参考设计蓝图。

DSX（Data Center Scale eXtended）平台是英伟达专为从零开始建设AI工厂而打造的完整实战指南。具体来看，DSX整合了开源模块化软件库、API、参考设计、英伟达加速计算平台及合作伙伴技术，打造出一个通用协同设计平台，专门用于AI工厂的设计、部署与运营。

其核心组件DSX MaxLPS（Lowest Power per Token System）直指自动驾驶产业的痛点：如何在既定电力预算内最大化每兆瓦Token产出。通过将45℃液冷技术与优化每瓦性能的机架级技术相结合，DSX MaxLPS让运营商能够在几乎不影响工作负载性能的前提下，将GPU运行在其最高能效点，从而额外部署高达40%的GPU。对于电力资源紧张、算力成本敏感的车企数据中心而言，这意味着同样的电费账单可以支撑更多的仿真训练里程。

DSX Sim则提供了面向AI工厂全生命周期的高保真仿真层，帮助英伟达、合作伙伴及客户对基础设施决策进行建模、验证和优化，贯穿从规划、设计到部署运营的每个环节。黄仁勋在演讲中强调："借助DSX平台，你甚至可以在花出一元钱之前，就对整座工厂进行全面模拟，在一台机柜装上之前，就能验证其性能表现。"

DSX Flex是将AI工厂与电网服务连接，使其能够根据负载削减、需求响应和电价波动等电网信号动态调整工作负载。这与自动驾驶的"V2G（Vehicle-to-Grid）"愿景形成奇妙呼应：未来的自动驾驶数据中心不仅是算力消费者，更是电网的"柔性负载"，在用电低谷时全力训练模型，在高峰时向电网反哺电力。

物理AI与机器人：Cosmos 3、Alphamale 2与Isaac GR0K

演讲的最后板块指向了智能体从数字世界走向物理世界的关键一跃。

黄仁勋提到，物理AI的核心难题是数据，互联网文本多为"第三人称视角"，而机器人需要"第一人称视角"的物理世界数据。英伟达的解决方案是Cosmos 3——开放的物理世界基础模型，可作为视觉语言模型理解物理场景，生成物理准确的合成视频，作为模拟器完成策略训练闭环，更是Omniverse数字孪生平台的基础。它支持所有类型的机器人与物理系统开发，完全开放并允许用户二次定制。