构建TCO最优的AI工厂,助力Token经济繁荣
4 小时前 / 阅读约3分钟
来源:C114
中兴通讯在2026年上海世界移动通信大会上展示基于OEX架构的超节点,通过架构级创新与系统级协同,提升Token生成效率,破解算力瓶颈,实现推理效率与算力能效的全面跃升。

近日,在2026年上海世界移动通信大会上,中兴通讯通过“从芯片、整机、集群、AIDC,到软件算法和调度平台”多个维度的协同设计、深度优化和加速,全面提升TPS,助力客户构建TCO最优的AI工厂,全面支撑Token经济的高效发展。

随着大模型进入推理规模化落地阶段,“每Token成本”成为衡量AI商业价值的核心指标。中兴通讯提出,只有通过架构级创新与系统级协同,才能实现Token生成效率的跃升。本次展出的基于OEX架构的超节点,正是破解算力瓶颈、提升能效比的关键创新成果。

首创OEX架构,定义下一代超节点标准

中兴通讯首创正交架构超节点理念,OEX(Orthogonal Electrical eXchange)架构采用无背板、0线缆设计,实现GPU、CPU、交换芯片等核心组件的物理解耦与灵活替换,支持CLink、SUE等主流高速互联协议,真正实现了“多芯协同、开放兼容、按需择优”。相比传统架构,基于OEX架构的超节点通信路径更短、信号损耗更低,整机互联效率明显提升,时延有效降低,系统可靠性更强。

中兴超节点单机柜实现128卡超高密集成,业界领先,并可Scale up至1.6万卡,构建超大规模集群,满足从千卡到万卡级AI训练与推理需求,为长会话、高并发的智能体场景提供坚实底座。

极致协同,推理效率与算力能效全面跃升

软硬协同,释放极致能效。通过多样资源精准调度与语义感知的智能路由,实现算力最优匹配,大幅降低推理成本。采用PD分离架构,结合网络提效、算子优化与多级KV缓存等技术,突破性能瓶颈,大幅提升吞吐能力。联合多厂商深度协同,在国产芯片平台推进异构混推与系统级调优,全面增强推理效率,实现TPS显著增长。

算存网协同,构建超大规模推理池。提供全系列AI服务器,支持单机8卡、16卡及单柜64卡/128卡高密部署,适配多场景需求。以DPU为核心打造AI原生KV缓存,实现GPU直通,零拷贝、微秒级时延与PB级扩展,结合智能预取与动态淘汰,缓存命中率超70%,有效提升推理效率。

携手生态,共建开放可演进的AI基础设施

中兴通讯强调,AI算力建设需兼顾性能、成本与可持续演进。中兴通讯基于OEX架构的超节点采用“算力集装箱”模式,通过前置式开发与统一工程规范,将新产品适配周期从一年缩短至半年内,加速生态融合与规模部署。