英伟达发布新GPU Rubin CPX，专为长上下文AI推理设计

2025-09-10 / 阅读约2分钟

来源：集微网

英伟达推出专为长上下文推理和视频生成设计的GPU Rubin CPX，翻倍提升AI推理效率，配备128GB内存，AI算力达30PFLOPS，Vera Rubin NVL144 CPX平台提供8EFLOPS性能。

英伟达周二（9月9日）宣布，推出专为长上下文推理和视频生成应用设计的专用GPU Rubin CPX，用于翻倍提升当前AI推理运算的工作效率，特别是编程、视频生成等需要超长上下文窗口的应用。

英伟达创始人兼CEO黄仁勋说：“正如RTX彻底改变了图形和物理AI一样，Rubin CPX是首款专为海量上下文AI打造的CUDA GPU，这种AI模型可以同时处理数百万个知识token的推理。”

Rubin是英伟达将在明年发售的下一代顶级算力芯片，基于Rubin的CPX预计也要到2026年底出货。下一代英伟达旗舰AI服务器的全称叫做NVIDIA Vera Rubin NVL144 CPX——集成36个Vera CPU、144块Rubin GPU和144块Rubin CPX GPU。

Rubin CPX配备128GB GDDR7内存，NVFP4精度下AI算力可达30PFLOPS，非常适合运行长上下文处理（超过100万个token）和视频生成任务。

Vera Rubin NVL144 CPX平台可在单机架集成144张Rubin CPX GPU、144张Rubin GPU、36张Vera CPU，提供8EFLOPS的AI性能（NVFP4精度）和100TB的快速内存，内存带宽达到1.7PB/s。

其AI性能是英伟达Vera Rubin NVL144平台的2倍多，是基于Blackwell Ultra的GB300 NVL72系统的7.5倍，相比GB300 NVL72系统还能提供3倍更快的注意力机制。

2 天前

英伟达年度“最危险”论文！AI自繁衍代码，无限刷级进化

2 天前

内存大涨价，玩家用 DDR1 平台成功运行 Win11 系统

2 天前

2 天前

省钱，我只服梁文锋

2 天前

比亚迪王传福与地平线 CEO 余凯会面，双方有望在智驾领域深度合作

1 天前

苹果代工厂塔塔电子被黑之际，iPhone 18 Pro Max 跌落测试视频流出

1 天前

OpenAI 成立“应急小组”，调查用户 Codex 额度消耗速度过快问题

2 天前

消息称 vivo X300 系列手机销量超 300 万台，Ultra 机型破 20 万

2 天前

2 天前