《自然》杂志发表新成果,英国深度思维公司推出AI“数学做题家”AlphaProof,它成功证明了复杂数学定理,并在2024年国际数学奥林匹克竞赛中取得了相当于银牌的成绩,展现了AI在高难度数学推理领域的显著进步。此前,深度思维公司曾透露,其混合AI系统在2004年的IMO竞赛中也有出色表现。用高水平竞赛题目测试AI,是评估其能力的重要标准,能否在IMO取得佳绩,是衡量AI“类人”深度推理能力的关键。为应对大型语言模型推理验证的难题,深度思维公司将强化学习引入Lean环境。AlphaProof专为证明数学命题而设计,超越了此前最先进的AI模型,并与AlphaGeometry联手解决了今年竞赛6道题中的4道。不过,AlphaProof目前仍存在局限,未来研究应拓展其通用性和适应性,克服障碍后有望助力数学家攻克难题,推动形式化证明与AI的深度融合。
