DeepSeekMath-V2实现可自验证的数学推理突破
2 天前

11月27日,DeepSeek在HuggingFace平台发布新型数学推理模型DeepSeekMath-V2,该模型采用可自我验证的训练框架,基于DeepSeek-V3.2-Exp-Base构建,通过LLM验证器自动审查数学证明,并利用高难度样本优化性能。在IMO 2025、CMO 2024中均获金牌,Putnam 2024获118/120分,模型代码与权重已开源。