英特尔打造高效异构 AI 系统:结合自家 Gaudi3 AI 加速器与英伟达 B200 GPU
4 小时前 / 阅读约1分钟
来源:IT之家
英特尔在2025 OCP全球峰会上展示高效异构AI系统,结合Gaudi3与B200,实现70%同TCO性能增益。

IT之家 10 月 20 日消息,英特尔在 2025 OCP 全球峰会上展示了其打造的一款高效异构 AI 系统,这一混合计算基础设施结合了英特尔自家的 Gaudi3 AI 加速器与英伟达的 B200 Tensor Core GPU。

具体而言,在该平台上 B200 负责 AI 模型的预填充而解码部分则由 Gaudi3 负责,相较仅 B200 的同构解决方案在 Llama 开源模型上实现了至高 70% 的同 TCO 性能增益

根据外媒 SemiAnalysis 的补充,这一混合机架系统采用了英伟达的 ConnectX-7 400GbE NIC、BlueField-3 DPU 和博通的 Tomahawk 5 51.2Tb/s 交换芯片,实现了更大的扩展域。

▲ 图源:SemiAnalysis

相关阅读:

  • 《首款专为大规模上下文 AI 设计的 CUDA GPU,英伟达 Rubin CPX 发布》