支持百万卡扩展，中科曙光发布国内首个开放架构 AI 超集群系统 - 云计算

热门话题

白天

搜索

资讯

支持百万卡扩展，中科曙光发布国内首个开放架构 AI 超集群系统

2025-09-05 / 阅读约2分钟

来源：IT之家

中科曙光发布国内首个基于AI计算开放架构的曙光AI超集群系统，以GPU为核心，实现一体化紧耦合设计，提供算力底座，支持多品牌AI加速卡，兼容主流软件生态，降低硬件和开发成本。

IT之家 9 月 5 日消息，在 9 月 5 日至 8 日的 2025 重庆世界智能产业博览会上，中科曙光发布了国内首个基于 AI 计算开放架构设计的产品 —— 曙光 AI 超集群系统。

该系统以 GPU 为核心，实现了“算、存、网、电、冷、管、软”一体化紧耦合设计，可为万亿参数大模型训练推理、行业大模型微调、多模态大模型开发、AI4S 等场景提供算力底座。

相比封闭系统，曙光 AI 超集群系统除了通过紧耦合设计像一台计算机般高效工作外，还支持多品牌 AI 加速卡以及兼容 CUDA 等主流软件生态，为用户提供更多开放性选择，并降低硬件成本和软件开发适配成本，保护前期投资。

IT之家附曙光 AI 超集群系统技术特点：

单机柜可搭载 96 张 GPU 卡、算力规模达百 P 级、访存总带宽超 180TB/s；支持多精度、混合精度运算；支持百万卡超大集群扩展。
千卡集群大模型训练推理性能达到业界主流水平 2.3 倍、开发效率提升 4 倍、人天投入减少 70%；存算传协同，提升 GPU 计算效率 55%；先进冷板液冷，394 项节能设计 PUE 低于 1.12。
121 项设备和链路 RAS 可靠性设计；平均无故障时间（MTBF）提高 2.1 倍；平均故障修复时间（MTTR）降低 47%；超 30 天长稳运行集群可靠性测试；实现百万级部件故障自动分析与秒级隔离。
基于 AI 计算开放架构设计；硬件适配多品牌 AI 加速卡；软件兼容主流 AI 计算生态；多项技术能力开放与共享。

2 天前

2026年《财富》中国科技50强：华为、字节、宁德时代领衔

2 天前

荣耀 Magic V6 包揽GLOMO亚洲两项重磅大奖

2 天前

黄仁勋：Prompt正在过时，Loop才是新范式

2 天前

Fable 5即将复活，代码已曝光？Anthropic CEO被白宫踢出来了