在2025年AI基础设施峰会上,英伟达发布了专为AI推理设计的Rubin CPX GPU。这款GPU基于Rubin架构,采用单片设计,配备128GB GDDR7显存,NVFP4精度下算力高达30 petaflops,专为处理数百万token的长上下文推理任务而优化。Rubin CPX可与Vera CPU和Rubin GPU组成Vera Rubin NVL144 CPX平台,单机架提供8 exaflops AI算力、100TB高速内存及1.7PB/s内存带宽,性能达GB300 NVL72系统的7.5倍。该GPU虽面向企业级AI工作负载,但因其保留光栅单元,可能成为未来RTX 6090显卡的基础,预计2026年底上市。