华为云CEO张平安:CloudMatrix384 AI Token服务全面上线
5 小时前

9月19日,在华为全联接大会2025(HC 2025)上,华为常务董事、华为云计算CEO张平安宣布,华为云CloudMatrix384 AI Token服务全面上线。依托华为最新AI服务器规划,CloudMatrix云上超节点规格将从384卡升级至未来的8192卡,构建50-100万卡的超大集群,为智能时代提供强大AI算力。该服务通过资源池化、全对等互联架构及xDeepServe推理框架,实现单卡推理吞吐2300 Tokens/s,性能达英伟达H20的3-4倍,并支持万亿参数大模型训练。目前,该服务已为Pangu、DeepSeek、Qwen等主流大模型提供极致Token服务,加速AI技术在各行业的落地与创新。