上海AI实验室开源书生大模型新一代训练引擎XTuner V1
2 天前

2025年9月8日,上海人工智能实验室开源书生大模型新一代训练引擎XTuner V1。该引擎伴随‘通专融合’技术路线演进及书生大模型研发实践而诞生,相较于传统3D并行训练引擎,XTuner V1能应对更复杂训练场景,训练速度更快,在超大规模稀疏混合专家模型训练中优势显著。研究团队与昇腾团队在昇腾384超节点(Atlas 900 A3 SuperPoD)上联合优化,相比业界其他产品,该超节点训练吞吐提升5%以上,MFU提升20%以上。此外,书生大模型研发中使用的AIOps工具DeepTrace与ClusterX也一并开源,为大规模分布式训练提供全方位保障。