月之暗面或因DeepSeek调整工作重心,强化学习成关注焦点
2025-02-15

月之暗面设定工作目标为持续取得SOTA(State Of The Art)成果,并计划在2025年前增强其模型的多模态与长文本推理能力。DeepSeek的崛起促使业界重新审视月之暗面的技术实力与用户增长模式,两者在闭源与开源策略、预训练与蒸馏技术等方面存在显著差异。尽管月之暗面尚未明确是否接入DeepSeek或采取开源策略,但有迹象显示,其或将强化学习作为未来工作重点,以应对DeepSeek等竞争对手的挑战。OpenAI的研究报告指出,中国的DeepSeek-R1与Kimi k1.5在数学解题与编程竞赛中表现优异,这进一步引发了业界对强化学习路线提升模型能力的关注。