科研领域新成果:九章云极DataCanvas联合团队发布R1复现以及改进技术
2025-03-14

中国人民大学STILL项目团队、北京智源研究院团队与九章云极DataCanvas公司在AI大模型慢思考推理技术上取得重要突破。他们成功复现了类R1推理模型,并详细开源了实现细节及训练技巧。此外,团队还创新性地提出利用代码工具提升模型推理性能的方法,并在AIME数学推理测试中,性能超越了DeepSeek-R1模型。相关研究成果已在预印版论文网站arXiv上发表,并在GitHub上公开了开源链接。 九章云极DataCanvas联合研究团队进一步发布了STILL-3-Tool-32B模型,该模型在AIME 2024基准测试中取得了81.70%的准确率,超越了DeepSeek-R1满血版的表现。团队还开源了在DataCanvas Alaya NeW智算操作系统上完成的全过程训练日志、奖励函数代码及容器化部署方案,充分展示了Alaya NeW在应对复杂任务框架时的显著优势。