5月8日,在2026移动云大会智算技术创新与生态共建暨算力网络联合创新分论坛期间,中国移动研究院副院长段晓东作主题为《Token时代算力网络的新思考和新方向》演讲,结合当前智算产业发展态势,深度解读算力网络全新发展阶段和体系化技术布局。

段晓东指出,Token时代下人工智能和大模型技术的快速迭代,智能体的的规模落地应用,驱动算力网络3.0从“AI Native”到“Token Native”,迈入发展新阶段,实现智算全栈技术跨越式升级。当前,行业呈现三大重要发展趋势:一是从设施到平台,全栈提升Token生成效能;二是从生产到输送,全流程优化Token供给质量;三是从算力堆叠到架构创新,全方位驱动智算根技术范式跃迁。
面向算力网络发展新阶段,中国移动在携手产业持续升级OISA、GSE、芯合等原创技术的基础上,以技术策源驱动Token Native算力网络3.0发展,提出三大纵深发展方向,即面向Token降本全面提升系统效能,面向Token提质全面提升网络能力,面向未来发展加速智算新范式演进,围绕三大方向进行技术体系化布局,涵盖异构PD分离推理引擎、广域KVCache多级调度、智能调度分发网络IDN、Scale-Across新型智算互联技术、光电融合等多项关键技术。中国移动协同上中下游合作伙伴,从技术、标准、产品、应用全方位推动产业成熟,筑牢全域智算发展底座。
一是面向token降本全面提升系统效能。Agent智能体爆发,模型调用井喷,产业重心从造模型全面转向用模型,从推理引擎能力和基础设施升级两大方向进行系统级优化。在推理引擎能力提升方面,“芯合”升级实现跨架构推理引擎,以算力抽象为核心构建多样化推理优化能力,屏蔽异构硬件差异、挖掘底层算力极致效能,降低推理成本,推动大模型转化为实际商业能力;同时重点聚焦广域KV Cache多级调度技术,构建以缓存为中心的推理加速网络基础设施,拉通全局存算资源,提升缓存命中率与缓存利用效率,加速大模型推理,压缩推理成本。在基础设施升级方面,创新提出基于内存处理单元MPU的新型架构,针对超长上下文推理导致KV Cache的容量爆炸与HBM访存瓶颈问题,实现GPU与显存/内存间统一寻址,有效提升GPU内存容量,降低延迟与能耗。
二是面向token提质全面提升网络能力。一方面中国移动发挥运营商算网资源优势与生态聚合能力,构建智能分发网络IDN(Intelligence Delivery Network),通过对智能要素与内容要素进行一体化管理、调度、优化、分发、进化,实现Token全生命周期效能最大化。另一方面打造新型智算互联技术,面向传统DCI向Scale-Across的演进趋势,革新报文分发、拥塞控制和安全加密等核心机制,实现GSE-DCI技术突破;同时,在超大规模智算集群互联方面,通过单通道400G技术革新芯片架构、光电融合方案与网络系统,满足智算集群超高带宽、极低功耗、超高密度的互联需求。
三是面向未来发展加速智算新范式演进。当前,传统以电为媒介的计算和互联能力逼近物理极限,亟需突破传统智算技术范式,以根技术革新开启提能升级新阶段。光互联方面,中国移动锚定高密度、可靠性、兼容性三大目标,打造“向光而行”的可重构光互连技术(DORA),以多产品可标准化集成、性能规格可灵活调整、局部故障可现场替换、技术方案可持续演进的技术理念,协同产业推动光电融合技术成熟;光计算方面,中国移动创新构建面向智算中心的光计算技术体系,从拓展计算能力、降低计算误差和繁荣应用生态三方面体系化布局,加速推动光计算落地应用;类脑计算方面,中国移动布局类脑计算技术体系,打造“瞬界”类脑计算品牌,聚焦类脑核心算法、软硬件关键技术和超节点系统,协同产、学、研、用等各方推动类脑计算技术成熟与成果转化,打造规模化行业示范应用。
