Kimi开源万亿参数模型K2,性能超全球主流开源模型
3 天前

月之暗面团队Kimi发布了MoE架构基础模型K2,并同步开源。该模型总参数达1T,激活参数32B,在自主编程、工具调用、数学推理等领域表现卓越,超越了全球其他开源模型。K2采用MuonClip优化器,实现了万亿参数模型的高效训练。面对高质量数据瓶颈,K2通过提升Token效率,开拓了新的预训练扩展空间。K2具备出色的代码能力和通用Agent任务处理能力,在多个实际场景中展现出强大的能力泛化和实用性。目前,新模型K2已上线开放体验。