构建TCO最优的AI工厂，助力Token经济繁荣 - 云计算

Just Quick Just Quality

热门话题

白天

搜索

资讯

构建TCO最优的AI工厂，助力Token经济繁荣

4 小时前 / 阅读约3分钟

来源：C114

中兴通讯在2026年上海世界移动通信大会上展示基于OEX架构的超节点，通过架构级创新与系统级协同，提升Token生成效率，破解算力瓶颈，实现推理效率与算力能效的全面跃升。

近日，在2026年上海世界移动通信大会上，中兴通讯通过“从芯片、整机、集群、AIDC，到软件算法和调度平台”多个维度的协同设计、深度优化和加速，全面提升TPS，助力客户构建TCO最优的AI工厂，全面支撑Token经济的高效发展。

随着大模型进入推理规模化落地阶段，“每Token成本”成为衡量AI商业价值的核心指标。中兴通讯提出，只有通过架构级创新与系统级协同，才能实现Token生成效率的跃升。本次展出的基于OEX架构的超节点，正是破解算力瓶颈、提升能效比的关键创新成果。

首创OEX架构，定义下一代超节点标准

中兴通讯首创正交架构超节点理念，OEX（Orthogonal Electrical eXchange）架构采用无背板、0线缆设计，实现GPU、CPU、交换芯片等核心组件的物理解耦与灵活替换，支持CLink、SUE等主流高速互联协议，真正实现了“多芯协同、开放兼容、按需择优”。相比传统架构，基于OEX架构的超节点通信路径更短、信号损耗更低，整机互联效率明显提升，时延有效降低，系统可靠性更强。

中兴超节点单机柜实现128卡超高密集成，业界领先，并可Scale up至1.6万卡，构建超大规模集群，满足从千卡到万卡级AI训练与推理需求，为长会话、高并发的智能体场景提供坚实底座。

极致协同，推理效率与算力能效全面跃升

软硬协同，释放极致能效。通过多样资源精准调度与语义感知的智能路由，实现算力最优匹配，大幅降低推理成本。采用PD分离架构，结合网络提效、算子优化与多级KV缓存等技术，突破性能瓶颈，大幅提升吞吐能力。联合多厂商深度协同，在国产芯片平台推进异构混推与系统级调优，全面增强推理效率，实现TPS显著增长。

算存网协同，构建超大规模推理池。提供全系列AI服务器，支持单机8卡、16卡及单柜64卡/128卡高密部署，适配多场景需求。以DPU为核心打造AI原生KV缓存，实现GPU直通，零拷贝、微秒级时延与PB级扩展，结合智能预取与动态淘汰，缓存命中率超70%，有效提升推理效率。

携手生态，共建开放可演进的AI基础设施

中兴通讯强调，AI算力建设需兼顾性能、成本与可持续演进。中兴通讯基于OEX架构的超节点采用“算力集装箱”模式，通过前置式开发与统一工程规范，将新产品适配周期从一年缩短至半年内，加速生态融合与规模部署。

上一篇：高力国际以全球视野赋能中资企业出海｜海外仓战略布局与精准选址

下一篇：广东移动携手华为完成4.9G大上行帧结构创新试点，上行流量激发效果明显

返回列表

热文阅读

2 天前

长江存储市占率突破13%！韩国大厂发出警告：中国追兵杀到了