腾讯邹贤能:迈向超万卡集群,光互联将迎来爆发
15 小时前 / 阅读约3分钟
来源:C114
腾讯邹贤能称国内光通信技术齐平北美,硅光在数据中心通信表现良好,Scale-Up网络实现高密度互联,光互联优势明显,十万卡集群功耗高,空芯光纤受关注但成本高。

C114讯 9月15日消息(水易)在2025年中国光博会(CIOE)期间举办的“超万卡智算集群新型光技术发展论坛”上,腾讯网络及数据中心负责人邹贤能在开场致辞中表示,过去的一年,国内光通信产业走在了世界前列,各项技术实现与北美齐平,值得称赞。

“超万卡智算集群需要网络互联。”邹贤能介绍,过去一年,硅光在Scale-Out网络中得到快速应用,目前腾讯已经使用超百万只量级。

在应用过程中,我们发现硅光非常适合数据中心通信,不管是质量,还是可运维等方面都有良好的表现。同时,以往硅光在几百米级别传输场景中表现优异,现在在2公里也有非常好的效果,甚至可以下沉到AOC。此外,LRO、LPO等技术也会在硅光基础上逐步演进。

邹贤能接着表示,过去半年,另一个令人兴奋的技术是Scale-Up。DeepSeek开源后,AI应用层出不穷,催生海量推理需求,传统一机8卡不能产生最好的推理效率,超节点和Scale-Up成为高频词汇。

Scale-Up网络使得在一个整机柜内实现256卡甚至512卡互联成为可能,但需要高带宽、低时延的网络。铜缆由于距离限制逐渐难以胜任,虽然有DAC产品的出现但其覆盖距离仍有限制。光互联在延迟和功耗方面具备明显优势,尤其适用于Scale-Up中对交换要求不高,但互联密度极高的场景,唯一的挑战是控制复杂度比电互联更高。

值得一提的是,目前万卡级集群已较为常见,而十万卡以上规模的集群功耗可达几十兆瓦甚至上百兆瓦,这不仅对电力供应提出了极高要求,“故障半径”的约束也变得更严格。这就需要跨多个园区,通过数据中心互联实现。

邹贤能指出,智算互联相比传统DCI在延迟等方面有更严格要求。近期空芯光纤企业备受关注,微软也在推进大规模部署。空芯光纤在延迟和损耗方面优势明显,目前唯一的缺点就是成本高,需要找到平衡点。

“在AI时代,过往一年的挑战很大、需求很大,我们取得了非常好的成果,也有很好的收益。”邹贤能表示,面向未来,无论是Scale-Out网络更好地应用硅光,还是Scale-UP网络,以及DCI互联,仍有诸多挑战。“希望大家共同合作,多多交流,共创智算光互联的最佳解决方案。”