英伟达发布Rubin CPX，专为大规模上下文推理设计 - 芯片

Just Quick Just Quality

热门话题

白天

搜索

资讯

英伟达发布Rubin CPX，专为大规模上下文推理设计

2025-09-10

在AI Infra Summit上，英伟达推出了专为大规模上下文处理设计的Rubin CPX GPU。该GPU基于Rubin架构，采用单片设计，内置NVFP4计算资源，提供高达30PFLOPS的算力，并配备128GB GDDR7内存，可应对苛刻的上下文工作负载。Rubin CPX能让AI系统高效处理百万级代码和生成视频，与GB300 NVL72系统相比，其注意力机制处理速度提升3倍。此外，Rubin CPX可与Vera CPU和Rubin GPU协同工作，构成Vera Rubin NVL144 CPX平台，单机架提供8EFLOPS的AI算力、100TB高速内存和每秒1.7PB的内存带宽，性能较GB300 NVL72提升7.5倍。该GPU预计于2026年底正式推出。

上一篇：中信证券：长江存储三期注册成立，持续利好国产存储链

下一篇：存储芯片板块震荡走强，协创数据涨超10%创新高

返回列表

热文阅读

2 天前

正浩、OPPO前高管创业AI智能运动手表，天使轮估值1亿美金 | 早期项目

2 天前

马斯克称特斯拉市值或超百万亿美元：需要付出巨大努力

2 天前

AI强驱动IC回温晶圆代工厂第1季可望“淡季不淡”

2 天前

英特尔低调叫停备受争议的软件定义芯片项目