美团开源 LongCat-Flash-Prover 大模型:5600 亿参数,刷新两项 SOTA 水平
5 小时前 / 阅读约2分钟
来源:IT之家
美团开源LongCat-Flash-Prover大模型,采用5677亿参数、MoE形态,旨在解决复杂数学证明问题。模型引入混合专家迭代框架,消除“幻觉”现象,在基准测试中刷新SOTA水平。
感谢IT之家网友 Domado 的线索投递!

IT之家 3 月 21 日消息,美团现已开源 LongCat-Flash-Prover 大模型,采用 5677 亿参数、MoE(混合专家模型)形态,旨在解决复杂的数学证明问题。

据介绍,该模型引入了混合专家迭代框架(hybrid-experts iteration framework),用于生成大规模、高质量的形式化推理轨迹。可通过整合 Lean4、基于 AST 的多阶段严格验证流程,消除“幻觉”现象。

训练方面,该模型使用混合专家迭代框架生成冷启动数据,并在强化学习阶段引入 HisPO 算法稳定 MoE 模型的长程任务训练。同时加入定理一致性和合法性检测机制防止 Reward Hacking(奖励黑客行为)。

基准测试表明,这款模型在 MiniF2F-Test 上取得 97.1% 的成绩,仅需 72 次推理尝试;在 PutnamBench 任务上解决了 41.5% 的问题,使用 118 次推理尝试,在上述两项测试中刷新 SOTA 水平。

IT之家附该模型开源地址如下:

  • GitHub:https://github.com/meituan-longcat/LongCat-Flash-Prover

  • Hugging Face:https://huggingface.co/meituan-longcat/LongCat-Flash-Prover