在2026年3月17日凌晨的英伟达GTC大会上,英伟达正式发布了专为AI推理设计的Groq 3 LPU芯片。这款芯片是英伟达去年以约200亿美元收购Groq核心技术资产后的首个重要成果。Groq 3 LPU作为语言处理单元,旨在通过架构创新优化语言模型的推理效率,特别针对低延迟解码与交互式推理场景。与主打训练和通用计算的GPU不同,Groq 3 LPU集成了500MB的片上SRAM,内存带宽高达150TB/s,远超HBM4的22TB/s,从而显著提升了AI解码操作的效率。该芯片采用全新的“Dynamo”异构推理架构,与Rubin GPU协同工作,将推理任务精细拆分,Rubin GPU负责复杂的Prefill和Attention计算,而LPU则专注处理低延迟的Token解码。这一架构标志着AI推理进入专用硬件协同时代,为实时性要求更高的应用铺平了道路。Groq 3 LPU计划于2026年下半年开始出货,并被整合进Vera Rubin平台,共同支撑AI从训练到落地的全流程。
