5月8日,在2026移动云大会开放智算技术与生态发展暨算力网络联合体分论坛期间,中国移动研究院携手中移齐鲁创新院以及华为、阿里、中兴、天数智芯、海光、壁仞、中科加禾、无问芯穹、浪潮、新华三等10家产业合作伙伴发布“芯合”2.5暨开放智算生态产业合作计划。

当前我国智算产业呈多元发展态势,各芯片厂商纷纷构建软硬一体竖井式生态,各自为“栈”、互不兼容,我国智算生态呈现“小、多、散”的碎片化特征,导致算力资源难以高效协同,成为制约产业融通发展的瓶颈。随着AI大模型爆发,“Token经营”已成为智能服务发展新方向,Token的高效生产离不开底层多元算力的极致效能发挥。为屏蔽异构硬件差异、融通智算生态竖井、提升多元算力Token生产效能,中国移动充分发挥国家移动信息产业链“链长”作用,以智算基础软件栈为攻关要点,于2022年创新提出“算力原生”技术体系,并引领成为业界广泛共识的主流技术路线,先后发布“芯合”异构超融合基础软件栈1.0和2.0版本,支持模型应用在英伟达、华为、阿里等9家智算芯片上的“一次开发、一次编译、跨芯流转迁移”,并通过第三方权威评测机构认证,相关指标业内领先。当前,“芯合”已上线国家信创产业基地、全国一体化算力网监测调度试验平台、国家中部算力互联互通枢纽节点、国资委人工智能焕新社区等国家重大战略工程,并在交通、工业、医疗等十余个垂直行业规模落地应用,有力促进了我国智算产业的繁荣发展、助力token经济提能增效。
面向Agentic人工智能发展新时代,中国移动研究院、中移齐鲁创新院联合产业合作伙伴共同研发“芯合”2.5版本,实现四大能力升级。一是一体池化调度,实现9家AI芯片的统一纳管与灵活编排,使能整卡、分卡、配额等细粒度调度能力,打通从资源接入、调度执行到监控运营全流程;二是一键部署优化,实现底层异构硬件规格与拓扑的自动感知,自动实施模型量化、参数寻优及策略匹配,多规格模型部署效率跃升7.5倍,系统吞吐性能提升96.5%,大幅缩短业务上线周期;三是一站智能转译,构建基于大模型与智能体的转译中枢,实现CUDA源码向国产化生态的自动转换,转译成功率提升至97%,打通从语法解析、智能重构到异构编译全开发流程;四是一模多芯混训,实现预训练、微调、强化学习全流程混合训练能力,高效聚合异构算力资源提升模型训练效率。
