人类遗忘的难题解法,被GPT-5重新找出来了
15 小时前 / 阅读约8分钟
来源:36kr
GPT-5 Pro通过图片定位到埃尔德什问题#339的关键文献,发现该问题2003年已解决。网友曾就该问题展开讨论,GPT-5 Pro还表现出色地识别了论文中的缺陷。

人类遗忘的难题解法,被GPT-5 Pro重新找出来了!

这事儿聚焦于埃尔德什问题#339,这是著名数学家保罗・埃尔德什提出或转述的近千道问题之一,收录于erdosproblems.com网站。该网站记录了每道题目的当前状态,其中约三分之一已解决,大部分仍待解。

此前该问题被标为处于“未解决”状态,属于待攻克的数学难题,不少人还在继续研究探讨。

直到最近,有人用GPT-5 Pro检索后才发现,该问题实际在2003年就已被解决了

尤其值得关注的是,GPT-5 Pro仅通过埃尔德什问题#339的图片,直接定位到了关键文献。

OpenAI研究员Sebastien Bubeck将此事分享出来后立马引发大量网友关注。

By the way,陶哲轩的著名成果之一,就是通过“遍历理论(ergodic theory)”工具,突破了“埃尔德什差异问题”这一困扰数学界几十年的猜想。

问题详情

具体来看,埃尔德什问题#339是数论中加法基方向的一个经典问题,表述为:

设A⊆N是一个r阶基(即每个足够大的整数都能表示为A中r个元素的和)。那么,能表示为A中恰好r个不同元素之和的整数集合,是否一定具有正的下密度?

此外,埃尔德什和格雷厄姆还提出一个相关问题:如果能表示为A中r个元素之和的整数集合具有正的上密度,那么能表示为A中恰好r个不同元素之和的整数集合,是否也一定具有正的上密度?

在GPT-5 Pro发现此问题已被解决前,网友们在网站上曾就此展开系列讨论。

网友Adenwalla从著名的Waring’s Problem(华林问题) 入手指出,几乎所有整数都可以表示为最多15个四次幂之和,但仍有无穷多个整数需要16个四次幂,即G(4)=16 but G₁(4)=15。

并据此引发思考,这是否意味着加法基问题中的下密度结论可能不成立?

很快,Woett、BorisAlexeev等指出,华林问题里的例子是“允许元素重复”的情况,而埃尔德什问题#339要求“元素互不相同”,因此该例并不能构成反例,原问题的条件更为严格。

之后讨论进一步深入。

zach Hunter试图探索加法基在不同规模下的密度稳定性,Woett则提出了一些具体的集合构造,尝试作为可能否定命题的反例。双方围绕“互不相同元素(distinct)”“下密度(lower density)”以及“有界倍增(bounded doubling)”等概念展开推敲。

最终,他们发现这些构造虽然能制造出和集大小存在稀疏甚至指数级间隙的例子,却仍无法让“能表示为恰好r个不同元素之和的整数集合”的下密度真正趋近于零,也就是说,这些反例构造并未成功否定命题。

就在网友们各执一词、对问题是否成立仍存争议之时。

msawhney提醒大家,其实这个问题早在2003年就已经被解决了。

核心依据是Hegyvari、Hennecart、Plagne发表于《J. reine angew. Math.》(即《Crelle》)第560卷、页199-220的论文《A proof of two Erdos’ conjectures on restricted addition and further results》

其中定理4直接构成了该问题的解答。

而找出这一答案的,正是GPT-5 Pro,它仅凭问题截图,就准确定位到了这篇文献。

关于保罗·埃尔德什

保罗·埃尔德什(Paul Erdős)是20世纪最杰出、最多产的数学家之一,以其在数论、组合数学、图论、概率论等领域的重大贡献而闻名。

一生发表了近1500篇论文,与超过500位合作者共同研究,其广泛合作精神使数学界出现了“埃尔德什数(Erdős number)”的概念,这一数字成为衡量数学家与埃尔德什学术关联紧密程度的“荣誉指标”。

他1913年出生于匈牙利布达佩斯。4岁时,已能心算多位数乘法;10岁时,自学了全部中学数学课程,并开始研究数论。

1934年,21岁的埃尔德什从布达佩斯大学获得博士学位,随后因战争等的影响开始“漂泊”——

没有固定职位,靠演讲费、奖金和朋友资助生活,常年携带一个行李箱,辗转于世界各地的大学和数学家家中,与同行合作研究、讨论问题,平均每几周就换一个地方。

埃尔德什一生以“问题驱动”的研究方式著称。他不追求体系化理论,而是不断提出、解决有趣的问题。他提出的数百个猜想至今仍活跃在数学前沿。

数论是埃尔德什投入最深、成果最丰的领域,他的工作直接推动了20世纪数论的发展,尤其在素数分布和加性数论方向影响深远。例如,他与挪威数学家Atle Selberg,用初等方法证明了素数定理,成果震惊数学界。

埃尔德什也是拉姆齐数研究的奠基人之一,他将概率论引入组合数论,给出了拉姆齐数的下界估计。

他提出的著名“埃尔德什差异问题”,可追溯到上世纪三四十年代。

内容是,给定一个由+1和-1组成的无限序列(如 (1, -1, 1, -1,…)),定义“前n项的部分和”为S (n),则“差异”是指所有部分和的绝对值的最大值。

埃尔德什猜想,任何这样的序列,其差异都会随着n的增大而无限增大(即不存在“有界差异”的无限±1序列)。

这一问题看似简单,却横跨数论、组合数学与调和分析,成为20世纪最著名的未解决猜想之一。直到2015年,数学家陶哲轩才通过引入“遍历理论”工具,取得了该猜想的部分突破。

即使在生命的最后几年,埃尔德什仍坚持研究数学、撰写论文。1996年,他在波兰华沙参加学术会议时突发心脏病去世,享年83岁。

2024年,英国数学家Thomas Bloom开设了一个专门研究埃尔德什问题的网站。

One More Thing

加州大学欧文分校数学教授Paata Ivanisvili也发推文表示,GPT-5Pro在识别已发表论文中的严重缺陷方面表现出色。

五年前,我花了数天时间研究这篇论文,才发现了一个作者后来确认的漏洞。而GPT-5 Pro仅用18分钟就找到了同样的漏洞,还额外发现了几个小问题。类似的情况我已经目睹过很多次了。

该推文还被OpenAI总裁Greg Brockman转发了。

网友表示这是一个强大的应用场景:

使用GPT-5 Pro来验证科学文献,能够极大地加快研究人员核实学术论断和发现逻辑矛盾的过程。

还有网友安利提示词小技巧:

在提示词中加入“请深度阅读——不要跳读,不要扫描——每次处理1000行”(please deep read - no grep, no scan - 1,000 lines at a time),堪称研读科学论文的终极技巧。

另一个建议是进行循环性核查(do a circularity audit)。

埃尔德什问题官网:https://www.erdosproblems.com/faq

参考链接:

[1]https://x.com/SebastienBubeck/status/1977181716457701775[2]https://x.com/gdb/status/1977153596811804890