中国联通实现全球最长距离大模型异构混训突破 - 云计算

Just Quick Just Quality

热门话题

白天

搜索

资讯

中国联通实现全球最长距离大模型异构混训突破

1 天前 / 阅读约2分钟

来源：集微网

中国联通联合合作伙伴发布全球最长距离大模型异构混训成果，实现跨域协同调度和异构资源融合技术突破，为下一代互联网产业奠定基础。通过超1500公里跨域混训系统，验证了高效训练千亿参数AI大模型的能力，推动人工智能领域发展，助力智能化转型。

在2025年中国联通合作伙伴大会期间，中国联通研究院联合上海人工智能实验室等合作伙伴，于7月19日正式发布了全球最长距离大模型异构混训试验成果。

随着人工智能技术的迅猛发展和大模型时代的到来，模型训练对算力基础设施的高吞吐、低时延、高性能提出了更高要求。然而，当前算力资源呈现出异构化和多中心化的格局，面临着跨域资源互联互通机制不健全、长距离传输存在带宽与时延瓶颈、异构资源统一调度与高效融合能力有限等挑战。

中国联通携手上海人工智能实验室、阿里云、浪潮、基流科技、加佳科技等行业合作伙伴，针对超大模型跨域训练和碎片化算力整合需求，依托“算力智联网 AINet”长距无损传输技术优势，结合上海人工智能实验室“DeepLink”超大规模跨域混训技术方案，在上海临港和山东济南鲍山数据中心间构建了长度超1500公里的跨域异构混训系统。

通过自动调整多种并行策略和跨域收敛比下MoE模型和Dense模型的参数配置，联合团队成功完成了超1500公里跨域的千亿参数AI大模型异构混训试验。经验证，等效算力可达单芯片单集群等效算力的95%以上。

在算力互联层面，项目采用了联通自研内置长距RDMA协议栈的RoCE交换机，兼顾数据中心内和数据中心间高性能网络需求；在算力调度与资源管理层面，通过联通“智驭”平台实现对跨域网络和集群的统一管控及任务调度；在算力协同层面，基于DeepLink在训练加速、异构通信、并行策略等核心技术，实现了千亿参数大模型在超长距离异构GPU环境下的高效训练。

此次试验的成功，不仅验证了中国联通在长距离算力协同方面的技术实力，也为未来大规模AI模型的跨域训练提供了有力支撑。随着这一技术的进一步应用和推广，有望推动人工智能领域的快速发展，助力各行各业实现智能化转型。

上一篇：从5G到AI：中国联通如何用"三融合"重塑电信运营商角色

下一篇：Oracle Database@Amazon Web Services现已正式可用

返回列表

热文阅读

2 天前

当海外Tier 1开始讲中国故事

2 天前

代码碾压一切！OpenAI神秘模型o3-alpha一夜刷屏，却遭41岁大神绝地反杀

2 天前

看了6座加长版Model Y L ，我觉得它并不好卖

2 天前