月之暗面公司推出了名为Kimi K2的大模型,该模型基于MoE架构,总参数高达1T,激活参数为32B。Kimi K2在代码能力、Agent任务及数学推理方面展现卓越性能,在多个基准测试中均取得了开源模型中的最优成绩(SOTA)。为提高训练效率,该模型采用了MuonClip优化器,并在Token利用效率上实现了显著突破。 此外,Kimi K2提供API服务,支持最长128K的上下文处理。其计费方案为每百万输入tokens收费4元,输出tokens收费16元。为满足不同需求,月之暗面还开源了两个版本:Kimi-K2-Base适用于科研自定义场景,而Kimi-K2-Instruct则更适用于通用指令任务。