字节跳动发布Seed Prover 1.5,形式化数学推理达到新高度
2 天前

据字节跳动官方消息,12月24日,Seed团队正式推出新一代形式化数学推理专用模型Seed Prover 1.5。该模型采用全新Agentic Prover架构,通过大规模Agentic RL训练,推理能力和效率显著提升。在16.5小时内,针对IMO 2025前5道题目生成完整可编译验证的Lean证明代码,成绩达35/42,超越金牌分数线。在北美本科数学竞赛Putnam中,9小时为12道赛题中的11道生成可编译验证的Lean代码。在Putnam历史评估集上解决了88%的问题,在硕士和博士生难度的评估集上分别解决了80%和33%的问题。目前,该模型技术报告已公开,后续将开放API。