在AI Infra Summit上,英伟达推出了专为大规模上下文处理设计的Rubin CPX GPU。该GPU基于Rubin架构,采用单片设计,内置NVFP4计算资源,提供高达30PFLOPS的算力,并配备128GB GDDR7内存,可应对苛刻的上下文工作负载。Rubin CPX能让AI系统高效处理百万级代码和生成视频,与GB300 NVL72系统相比,其注意力机制处理速度提升3倍。此外,Rubin CPX可与Vera CPU和Rubin GPU协同工作,构成Vera Rubin NVL144 CPX平台,单机架提供8EFLOPS的AI算力、100TB高速内存和每秒1.7PB的内存带宽,性能较GB300 NVL72提升7.5倍。该GPU预计于2026年底正式推出。