如果炒作是奥运项目的话,Sam Altman 的奖牌数将创下纪录。
在 X 上,这是网友对这段时间 GPT-5 营销狂轰滥炸的锐评。
从 OpenAI 宣布自己达到了 IMO 金牌水平以来,对它高热度营销的诟病就一直没有停下来过。
几乎每天,都有一点关于 GPT-5 的消息被「不经意」地放出。一会儿是 Altman 在播客上感叹自己「相对于 AI 毫无用处」;一会儿是 The Information 深度报道其内部挑战重重;一会儿又是在 X 上晒出与 GPT-5 的聊天截图……
大家的胃口是被吊足了,但关于产品的核心信息,却始终若隐若现。
过去一段时间来,GPT-5 貌似一直是「最热的未来产品」。从去年开始就陆续有媒体在爆料,发布时间的传闻从去年一路传到今年 8 月。
结果是,OpenAI 的确在刷新各种 benchmark,但大家期待的 GPT-5 却迟迟没有现身。
根据 OpenAI 官方模型发布公告整理
OpenAI 的 benchmark 越是刷新,大家的兴奋感反而越低。毕竟,马斯克都要靠二次元动漫角色 Ani 来获得流量关注了,而 Grok 4 刷新了多少榜单根本提不起大家的兴趣。
所以,OpenAI 看起来也转向了一种新节奏,靠不断「暗示」、不断「吊胃口」来保持热度。
我们整理了近期所有关于 GPT-5 的爆料和报道,试图跳出这套营销叙事,看清在漫长的预热背后,OpenAI 接下来到底在押什么注。GPT-5 在真正到来之前,还有哪些值得关注的信号。
与以往更新不同,GPT-5 的最大亮点并非空泛的跑分提升,而是在多模态、软件工程和AI 智能体(Agent)这三个极具实用价值的领域,展现了相当大的性能提升。
实现「完整的多模态」能力
这是最新爆料中最大、也最令人兴奋的特性。据专栏 SemiconSam 博主@Jukanlosreve 公开的一份专家电话会议纪要透露,GPT-5 最显著的特点是「多模态能力的显著提升,实现了一个完整的多模态模型」。
截图来自:https://semiconsam.substack.com/p/script-for-expert-call-nvidia-h20
这意味着它在处理和生成图文、音视频等多种信息流上的能力将远超以往,有望带来「吉卜力时刻」的用户体验,并在发布后登顶绝大多数评测榜单 。
软件工程能力的大幅提升
GPT-5 不再局限于解决算法竞赛题,而是能深入到大型、陈旧、复杂的企业级代码库中进行修改和维护。这被视为 OpenAI 直接挑战 Anthropic Claude 在编程领域优势地位的重磅武器。
一位测试者甚至表示,在他们的横向比较中,GPT-5 的表现优于 Anthropic 的 Claude Sonnet 4。
同时,作为 OpenAI 最重要的合作伙伴,微软内部员工在测试后透露,GPT-5 在产出高质量代码的同时,并没有消耗更多的计算资源。
图片来自:https://x.com/SadAlbert10/status/1951306799900139976
X 上有用户分享通过 OpenAI API 免费尝试了 GPT-5,并用它做了一个六边形振动测试的 HTML 页面,看起来效果确实很不错。
真正可用的 AI Agent
更强的推理能力,意味着 GPT-5 能更好地理解和执行复杂的多步骤指令,从而以更少的人工监督来执行多步骤任务,向着能够自主完成任务的「AI 智能体」迈出了关键一步。
例如,有媒体称它可以遵循一套复杂的规则,来判断自动客服代理是否应该批准退款,而此前的模型则需要大量具体案例才能学会。
攻克主观领域的「通用验证器」
为了解决推理模型难以评估的问题,OpenAI 开发了一项名为 「通用验证器」(universal verifier) 的技术。
值得关注的是,这项名为「通用验证器」的工作,还是 Ilya 之前带领的超级对齐团队在去年完成的。
它的本质上是另一个 AI,专门负责检查和评估主模型的回答质量,即使是在没有标准答案的场景下。因此 GPT-5 不仅在编程和数学等可验证领域表现出色,在创意写作、策略分析等主观性更强的领域也取得了进步。
这项技术也是 OpenAI 能在国际数学奥林匹克竞赛中摘金的关键。
图片来自:https://www.reddit.com/r/OpenAI/comments/1mettre/gpt5_is_already_ostensibly_available_via_api/
Reddit 上也有网友分享自己透过 OpenAI API 获得了 GPT-5 的访问权限,并用 GPT-5 生成了一张图片,他在评论区里面提到生成这张图片用了 50 多秒,他倾向于认为所使用的并不是 GPT-5 mini 版本。
而我们使用 ChatGPT-4o 生成的图像则更像是简笔画。
要实现上述强大的功能,GPT-5 依赖于其最核心的一项变化:一个能自动为用户选择最优解的智能调度系统。
综合多家媒体的报道,与以往单纯追求更大参数规模的路径不同,GPT-5 旨在将传统的 GPT 语言模型与专注于推理的「o」系列模型(如 o1、o3)整合在一起。
如果你跟我一样曾经对 GPT-4o、o4、GPT-4.1 等令人眼花缭乱的模型名称感到困惑,那么 GPT-5 的首要目标就是终结我们的「选择困难症」。
ChatGPT 内提供的模型,有擅长编码、分析、处理日常任务、写作、推理等等
一些研究人员推测,GPT-5 可能并非单一模型,而是一个智能「路由系统」,能根据用户问题的难度,动态选择调用最合适的模型来处理。
对于简单请求:它会调用更快速、成本更低的 GPT 系列模型,实现即时响应。
对于复杂难题:如 STEM(科学、技术、工程和数学)或深度编程问题,它会自动切换到更强大的推理模型,进行更深入的「思考」,确保答案的质量。
OpenAI ChatGPT 负责人 Nick Turley 对此的愿景是:「我们的目标是让普通用户无需再思考该用哪个模型」。相反,目标是让 GPT-5 自动为用户的任务选择最佳模型。
时间:虽然早在 2023 年末,就有媒体称 OpenAI 可能会在 2024 春季或夏季发布 GPT-5。然而到了 2024 年 5 月,OpenAI 的官方当时表示,
近些日子已经开始训练公司的「下一代前沿模型」,预计这个新系统将达到通往 AGI(通用人工智能)的「下一个能力水平」。
到了 2025 年,有关发布时间的传闻消息更加密集。六月份,在奥特曼的访谈视频里,他说 GPT-5 「可能是在今年夏天的某个时候」会发布。
七月份,有媒体称为了应对欧盟的 AI 监管法律生效,OpenAI 会在七月底发布 GPT-5。之后,The Verge 又透露 OpenAI 计划在八月初推出 GPT-5。
昨天,X 上还有网友截到了奥特曼发文说 20 个小时之后见,不过这条推文很快被删掉了,也无法证实奥特曼是否有发布该则推文。
而随着最近几天 Perplexity、Cursor、Microsoft Copilot、Flowith、以及 ChatGPT macOS 应用和网站上,都开始有出现 GPT-5 的踪迹,我想发布的时间应该不会再拖太久。
图片来源:https://x.com/testingcatalog/
更确切的信息,则是几天前《连线》杂志报道 Anthropic 切断了 OpenAI 对 Claude API 的访问。
OpenAI 被指利用 API 对 Claude 的功能(如编码和创意写作)进行测试,并与其自家模型进行比较,而这被视为「构建竞争产品」,其行为是违反了 Anthropic 的商业条款。
OpenAI 则对此表达了失望,称自己也为 Anthropic 提供了类似的 API 访问权限。
很明显这应该是OpenAI 在为 GPT-5 最后的发布做准备。
目前,综合多个消息源的信息,GPT-5 的发布时间仍是指向 2025 年 8 月初。
X 上还有网友等麻了,揪着一条 OpenAI 研究员发布推文的时间,说这是为 GPT-5 的发布时间埋下了彩蛋,8:05 就说明是八月五号。
「因为一天有 1440 分钟,为什么他刚好就在 8:05 发布了这则推文,这肯定不是巧合。」
Boris Power 是 OpenAI 应用研究负责人,这条推文发布时间在相差 13 个小时时差的地区(加州时间)会显示 8:05 AM。
GPT-5 的发布时间快定下来吧,不然大家都等「疯」了。
版本:预计 GPT-5 将提供多个版本。主要的「推理整合版」将通过 ChatGPT 和 API 提供 ;「迷你版」(mini)也将登陆 ChatGPT 和 API ;而「纳米版」(nano)预计将仅通过 API 提供。
微软与 OpenAI 的协议:在那份披露的电话记录中,提到微软与 OpenAI 的新合作协议,实质是微软在利用 OpenAI 来弥补自身模型研发的不足(如优化 Copilot 和 Bing),为自己的独立研发争取时间。协议中有意模糊了 AGI 的定义,更侧重于短期的技术互补。
协议中提到 AGI 的规定是,「当OpenAI 实现通用人工智能后,微软将失去使用该初创公司先进技术的部分权利」。
爆料博主信息,他发推文表示自己不是电话记录里面那个回答的人,他觉得可以通过出售这个赚很多钱,但他决定免费发布。
部分关于 OpenAI 的爆料情况
在这些亮眼的功能和发布信息背后,是一段充满挑战的研发历程,除了爆料里面提到 OpenAI 近期使用了17 万至 18 万张 GPU来完成 GPT-5 的训练,这一惊人的训练规模。
要理解 GPT-5 为何会选择这条路,根据 The Information 的独家报道,我们回顾了 OpenAI 近几年的技术演进路线。
1、缩放为王与「Orion」的陨落
从 2020 年的 GPT-3 到 2023 年的 GPT-4,OpenAI 乃至整个行业都信奉着「缩放定律」(Scaling Law)。即更大的模型、更多的数据,就能带来更强的智能。这一策略催生了 ChatGPT 的辉煌,但模型在逻辑、数学等需要严谨推理的领域始终步履维艰。
然而,这条路的尽头似乎比预想的更早到来。
在内部,一个代号为 「Orion」 的宏大项目曾被寄予厚望,它本该是 GPT-5 的前身,但现实却泼了一盆冷水。
研究人员发现,传统的预训练方法开始遭遇瓶颈,高质量的网络数据日益枯竭,许多在小模型上验证有效的训练技巧,在模型规模扩大后便神秘失效。
最终,Orion 未能实现预期的性能飞跃,惨遭降级,并在 2025 年 2 月以 GPT-4.5 的名义悄然发布,很快便无人问津。这标志着 OpenAI 第一次在「缩放定律」这条路上撞上了南墙。
2、推理的成功与 Q* 的惊喜
幸运的是,另一条道路早已在悄然探索中。早在 ChatGPT 诞生之前,公司内部一个名为 MathGen 的团队就在默默研究如何让模型解决数学竞赛难题。
他们的工作,最终与强化学习(RL) 和测试时计算(test-time computation,允许模型在推理过程中多思考一会儿)等技术结合,在 2023 年底引发了一场内部地震。
这就是后来广为人知的 Q*(或称 Strawberry) 技术突破。它让模型首次能够解决从未见过的数学问题,其表现出的推理能力让研究员们震惊不已,甚至「看到了模型在思考、在犯错、在回溯、在沮丧,就像在阅读一个人的思考过程」。
3、「天才」的诞生与烦恼
Q* 的突破直接催生了专注于推理的 o 系列模型(o1、o3)。这些「母体模型」在内部测试中展现出惊人的能力,它们被给予了更多的英伟达芯片算力,甚至被赋予了联网搜索和调用代码库的能力,从而在科学等领域取得了非凡的进步。
但「天才」也有烦恼。当研究人员试图将强大的 o3 母体模型转化为一个能与普通人对话的聊天版本时,它的性能出现了严重退化。一位内部人士将其形容为,为了迁就人类的语言,而将一个「用自己独特逻辑思考的天才」强行「降智」。
在焦急的等待中,OpenAI 的高层也不断地在释放一些信号以更好的预热 GPT-5。
CEO Sam Altman 近期在一次播客节目中分享了一个亲身经历。
他向 GPT-5 提出了一个自己无法理解的难题,结果模型完美地解答了。他形容那一刻自己「感觉相对于 AI 毫无用处」,并称之为一种「怪异的感觉」。这无疑极大地拉高了外界的期待。
昨天,他又在 X 上分享了自己与 GPT-5 的聊天页面,他向 GPT-5 提问什么是最发人深省的 AI 题材电视剧,截图显示 GPT-5 向他推荐了《万神殿 Pantheon》和《Devs》。
有用户评论说从这个截图看不出 GPT-5 和现在的 ChatGPT 有什么区别,但是这波热度是又被奥特曼拿下了。
ChatGPT agent 发布的时候,我在社交媒体上看到一个评论。
里面说,以前是 OpenAI 做什么,大家跟着做什么,现在可能是 Anthropic 做什么,大家跟着做什么。
他提到 OpenAI 现在方方面面都比不上 Anthropic,编程、幻觉抑制、安全、以及 MCP 都是属于 Anthropic,而 OpenAI 却只是一直说自己拿了哪些 benchmark。
今天,OpenAI 看起来又拿下了一个榜单,「最会营销」的榜单。
在 Anthropic、Google、Meta、xAI 等强大对手的激烈竞争下,这次发布可能对 OpenAI 至关重要。
Logan Kilpatrick 是 Google DeepMind 集团产品经理,Steven Heidel 是 OpenAI 技术工程师,预计Gemini 3也快要发布。
GPT-5 不仅要赢回在特定领域,像是编程这块失去的阵地;更要向世界证明,OpenAI 是依然有能力引领 AI 走向更自主、更通用的未来前进。
附上部分参考资料地址:
https://www.theinformation.com/articles/inside-openais-rocky-path-gpt-5
https://www.theinformation.com/articles/openais-gpt-5-shines-coding-tasks
https://www.businessinsider.com/openai-ceo-sam-altman-teases-gpt-5-2025-8
https://www.theverge.com/notepad-microsoft-newsletter/712950/openai-gpt-5-model-release-date-notepad
https://www.wired.com/story/anthropic-revokes-openais-access-to-claude/
https://www.zdnet.com/article/this-one-feature-will-make-gpt-5-a-game-changer-if-openai-gets-it-right/
https://www.zdnet.com/article/openai-teases-imminent-gpt-5-launch-heres-what-to-expect/