我们扒完了 GPT-5 全网爆料，奥特曼和 OpenAI 这次的饼真不好画了 - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

我们扒完了 GPT-5 全网爆料，奥特曼和 OpenAI 这次的饼真不好画了

2025-08-05 / 阅读约17分钟

来源：36kr

每天都在爆料，GPT-5 却从未真正现身。

如果炒作是奥运项目的话，Sam Altman 的奖牌数将创下纪录。

在 X 上，这是网友对这段时间 GPT-5 营销狂轰滥炸的锐评。

从 OpenAI 宣布自己达到了 IMO 金牌水平以来，对它高热度营销的诟病就一直没有停下来过。

几乎每天，都有一点关于 GPT-5 的消息被「不经意」地放出。一会儿是 Altman 在播客上感叹自己「相对于 AI 毫无用处」；一会儿是 The Information 深度报道其内部挑战重重；一会儿又是在 X 上晒出与 GPT-5 的聊天截图……

大家的胃口是被吊足了，但关于产品的核心信息，却始终若隐若现。

过去一段时间来，GPT-5 貌似一直是「最热的未来产品」。从去年开始就陆续有媒体在爆料，发布时间的传闻从去年一路传到今年 8 月。

结果是，OpenAI 的确在刷新各种 benchmark，但大家期待的 GPT-5 却迟迟没有现身。

根据 OpenAI 官方模型发布公告整理

OpenAI 的 benchmark 越是刷新，大家的兴奋感反而越低。毕竟，马斯克都要靠二次元动漫角色 Ani 来获得流量关注了，而 Grok 4 刷新了多少榜单根本提不起大家的兴趣。

所以，OpenAI 看起来也转向了一种新节奏，靠不断「暗示」、不断「吊胃口」来保持热度。

我们整理了近期所有关于 GPT-5 的爆料和报道，试图跳出这套营销叙事，看清在漫长的预热背后，OpenAI 接下来到底在押什么注。GPT-5 在真正到来之前，还有哪些值得关注的信号。

GPT-5 的核心升级，统一了基础和推理模型

与以往更新不同，GPT-5 的最大亮点并非空泛的跑分提升，而是在多模态、软件工程和AI 智能体（Agent）这三个极具实用价值的领域，展现了相当大的性能提升。

实现「完整的多模态」能力

这是最新爆料中最大、也最令人兴奋的特性。据专栏 SemiconSam 博主@Jukanlosreve 公开的一份专家电话会议纪要透露，GPT-5 最显著的特点是「多模态能力的显著提升，实现了一个完整的多模态模型」。

截图来自：https://semiconsam.substack.com/p/script-for-expert-call-nvidia-h20

这意味着它在处理和生成图文、音视频等多种信息流上的能力将远超以往，有望带来「吉卜力时刻」的用户体验，并在发布后登顶绝大多数评测榜单。

软件工程能力的大幅提升

GPT-5 不再局限于解决算法竞赛题，而是能深入到大型、陈旧、复杂的企业级代码库中进行修改和维护。这被视为 OpenAI 直接挑战 Anthropic Claude 在编程领域优势地位的重磅武器。

一位测试者甚至表示，在他们的横向比较中，GPT-5 的表现优于 Anthropic 的 Claude Sonnet 4。

同时，作为 OpenAI 最重要的合作伙伴，微软内部员工在测试后透露，GPT-5 在产出高质量代码的同时，并没有消耗更多的计算资源。

图片来自：https://x.com/SadAlbert10/status/1951306799900139976

X 上有用户分享通过 OpenAI API 免费尝试了 GPT-5，并用它做了一个六边形振动测试的 HTML 页面，看起来效果确实很不错。

真正可用的 AI Agent

更强的推理能力，意味着 GPT-5 能更好地理解和执行复杂的多步骤指令，从而以更少的人工监督来执行多步骤任务，向着能够自主完成任务的「AI 智能体」迈出了关键一步。

例如，有媒体称它可以遵循一套复杂的规则，来判断自动客服代理是否应该批准退款，而此前的模型则需要大量具体案例才能学会。

攻克主观领域的「通用验证器」

为了解决推理模型难以评估的问题，OpenAI 开发了一项名为「通用验证器」（universal verifier）的技术。

值得关注的是，这项名为「通用验证器」的工作，还是 Ilya 之前带领的超级对齐团队在去年完成的。

它的本质上是另一个 AI，专门负责检查和评估主模型的回答质量，即使是在没有标准答案的场景下。因此 GPT-5 不仅在编程和数学等可验证领域表现出色，在创意写作、策略分析等主观性更强的领域也取得了进步。

这项技术也是 OpenAI 能在国际数学奥林匹克竞赛中摘金的关键。

图片来自：https://www.reddit.com/r/OpenAI/comments/1mettre/gpt5_is_already_ostensibly_available_via_api/

Reddit 上也有网友分享自己透过 OpenAI API 获得了 GPT-5 的访问权限，并用 GPT-5 生成了一张图片，他在评论区里面提到生成这张图片用了 50 多秒，他倾向于认为所使用的并不是 GPT-5 mini 版本。

而我们使用 ChatGPT-4o 生成的图像则更像是简笔画。

要实现上述强大的功能，GPT-5 依赖于其最核心的一项变化：一个能自动为用户选择最优解的智能调度系统。

综合多家媒体的报道，与以往单纯追求更大参数规模的路径不同，GPT-5 旨在将传统的 GPT 语言模型与专注于推理的「o」系列模型（如 o1、o3）整合在一起。

如果你跟我一样曾经对 GPT-4o、o4、GPT-4.1 等令人眼花缭乱的模型名称感到困惑，那么 GPT-5 的首要目标就是终结我们的「选择困难症」。

ChatGPT 内提供的模型，有擅长编码、分析、处理日常任务、写作、推理等等

一些研究人员推测，GPT-5 可能并非单一模型，而是一个智能「路由系统」，能根据用户问题的难度，动态选择调用最合适的模型来处理。

对于简单请求：它会调用更快速、成本更低的 GPT 系列模型，实现即时响应。

对于复杂难题：如 STEM（科学、技术、工程和数学）或深度编程问题，它会自动切换到更强大的推理模型，进行更深入的「思考」，确保答案的质量。

OpenAI ChatGPT 负责人 Nick Turley 对此的愿景是：「我们的目标是让普通用户无需再思考该用哪个模型」。相反，目标是让 GPT-5 自动为用户的任务选择最佳模型。

发布、版本与最后的悬念

时间：虽然早在 2023 年末，就有媒体称 OpenAI 可能会在 2024 春季或夏季发布 GPT-5。然而到了 2024 年 5 月，OpenAI 的官方当时表示，

近些日子已经开始训练公司的「下一代前沿模型」，预计这个新系统将达到通往 AGI（通用人工智能）的「下一个能力水平」。

到了 2025 年，有关发布时间的传闻消息更加密集。六月份，在奥特曼的访谈视频里，他说 GPT-5 「可能是在今年夏天的某个时候」会发布。

七月份，有媒体称为了应对欧盟的 AI 监管法律生效，OpenAI 会在七月底发布 GPT-5。之后，The Verge 又透露 OpenAI 计划在八月初推出 GPT-5。

昨天，X 上还有网友截到了奥特曼发文说 20 个小时之后见，不过这条推文很快被删掉了，也无法证实奥特曼是否有发布该则推文。

而随着最近几天 Perplexity、Cursor、Microsoft Copilot、Flowith、以及 ChatGPT macOS 应用和网站上，都开始有出现 GPT-5 的踪迹，我想发布的时间应该不会再拖太久。

图片来源：https://x.com/testingcatalog/

更确切的信息，则是几天前《连线》杂志报道 Anthropic 切断了 OpenAI 对 Claude API 的访问。

OpenAI 被指利用 API 对 Claude 的功能（如编码和创意写作）进行测试，并与其自家模型进行比较，而这被视为「构建竞争产品」，其行为是违反了 Anthropic 的商业条款。

OpenAI 则对此表达了失望，称自己也为 Anthropic 提供了类似的 API 访问权限。

很明显这应该是OpenAI 在为 GPT-5 最后的发布做准备。

目前，综合多个消息源的信息，GPT-5 的发布时间仍是指向 2025 年 8 月初。

X 上还有网友等麻了，揪着一条 OpenAI 研究员发布推文的时间，说这是为 GPT-5 的发布时间埋下了彩蛋，8:05 就说明是八月五号。

「因为一天有 1440 分钟，为什么他刚好就在 8:05 发布了这则推文，这肯定不是巧合。」

Boris Power 是 OpenAI 应用研究负责人，这条推文发布时间在相差 13 个小时时差的地区（加州时间）会显示 8:05 AM。

GPT-5 的发布时间快定下来吧，不然大家都等「疯」了。

版本：预计 GPT-5 将提供多个版本。主要的「推理整合版」将通过 ChatGPT 和 API 提供；「迷你版」（mini）也将登陆 ChatGPT 和 API ；而「纳米版」（nano）预计将仅通过 API 提供。

微软与 OpenAI 的协议：在那份披露的电话记录中，提到微软与 OpenAI 的新合作协议，实质是微软在利用 OpenAI 来弥补自身模型研发的不足（如优化 Copilot 和 Bing），为自己的独立研发争取时间。协议中有意模糊了 AGI 的定义，更侧重于短期的技术互补。

协议中提到 AGI 的规定是，「当OpenAI 实现通用人工智能后，微软将失去使用该初创公司先进技术的部分权利」。

爆料博主信息，他发推文表示自己不是电话记录里面那个回答的人，他觉得可以通过出售这个赚很多钱，但他决定免费发布。

部分关于 OpenAI 的爆料情况

挑战不断，GPT-5 艰难的诞生背景

在这些亮眼的功能和发布信息背后，是一段充满挑战的研发历程，除了爆料里面提到 OpenAI 近期使用了17 万至 18 万张 GPU来完成 GPT-5 的训练，这一惊人的训练规模。

要理解 GPT-5 为何会选择这条路，根据 The Information 的独家报道，我们回顾了 OpenAI 近几年的技术演进路线。

1、缩放为王与「Orion」的陨落

从 2020 年的 GPT-3 到 2023 年的 GPT-4，OpenAI 乃至整个行业都信奉着「缩放定律」（Scaling Law）。即更大的模型、更多的数据，就能带来更强的智能。这一策略催生了 ChatGPT 的辉煌，但模型在逻辑、数学等需要严谨推理的领域始终步履维艰。

然而，这条路的尽头似乎比预想的更早到来。

在内部，一个代号为「Orion」的宏大项目曾被寄予厚望，它本该是 GPT-5 的前身，但现实却泼了一盆冷水。

研究人员发现，传统的预训练方法开始遭遇瓶颈，高质量的网络数据日益枯竭，许多在小模型上验证有效的训练技巧，在模型规模扩大后便神秘失效。

最终，Orion 未能实现预期的性能飞跃，惨遭降级，并在 2025 年 2 月以 GPT-4.5 的名义悄然发布，很快便无人问津。这标志着 OpenAI 第一次在「缩放定律」这条路上撞上了南墙。

2、推理的成功与 Q* 的惊喜

幸运的是，另一条道路早已在悄然探索中。早在 ChatGPT 诞生之前，公司内部一个名为 MathGen 的团队就在默默研究如何让模型解决数学竞赛难题。

他们的工作，最终与强化学习（RL）和测试时计算（test-time computation，允许模型在推理过程中多思考一会儿）等技术结合，在 2023 年底引发了一场内部地震。

这就是后来广为人知的 Q*（或称 Strawberry）技术突破。它让模型首次能够解决从未见过的数学问题，其表现出的推理能力让研究员们震惊不已，甚至「看到了模型在思考、在犯错、在回溯、在沮丧，就像在阅读一个人的思考过程」。

3、「天才」的诞生与烦恼

Q* 的突破直接催生了专注于推理的 o 系列模型（o1、o3）。这些「母体模型」在内部测试中展现出惊人的能力，它们被给予了更多的英伟达芯片算力，甚至被赋予了联网搜索和调用代码库的能力，从而在科学等领域取得了非凡的进步。

但「天才」也有烦恼。当研究人员试图将强大的 o3 母体模型转化为一个能与普通人对话的聊天版本时，它的性能出现了严重退化。一位内部人士将其形容为，为了迁就人类的语言，而将一个「用自己独特逻辑思考的天才」强行「降智」。

近期奥特曼的「凡尔赛」时刻

在焦急的等待中，OpenAI 的高层也不断地在释放一些信号以更好的预热 GPT-5。

CEO Sam Altman 近期在一次播客节目中分享了一个亲身经历。

他向 GPT-5 提出了一个自己无法理解的难题，结果模型完美地解答了。他形容那一刻自己「感觉相对于 AI 毫无用处」，并称之为一种「怪异的感觉」。这无疑极大地拉高了外界的期待。

昨天，他又在 X 上分享了自己与 GPT-5 的聊天页面，他向 GPT-5 提问什么是最发人深省的 AI 题材电视剧，截图显示 GPT-5 向他推荐了《万神殿 Pantheon》和《Devs》。

有用户评论说从这个截图看不出 GPT-5 和现在的 ChatGPT 有什么区别，但是这波热度是又被奥特曼拿下了。

ChatGPT agent 发布的时候，我在社交媒体上看到一个评论。

里面说，以前是 OpenAI 做什么，大家跟着做什么，现在可能是 Anthropic 做什么，大家跟着做什么。

他提到 OpenAI 现在方方面面都比不上 Anthropic，编程、幻觉抑制、安全、以及 MCP 都是属于 Anthropic，而 OpenAI 却只是一直说自己拿了哪些 benchmark。

今天，OpenAI 看起来又拿下了一个榜单，「最会营销」的榜单。

在 Anthropic、Google、Meta、xAI 等强大对手的激烈竞争下，这次发布可能对 OpenAI 至关重要。

Logan Kilpatrick 是 Google DeepMind 集团产品经理，Steven Heidel 是 OpenAI 技术工程师，预计Gemini 3也快要发布。

GPT-5 不仅要赢回在特定领域，像是编程这块失去的阵地；更要向世界证明，OpenAI 是依然有能力引领 AI 走向更自主、更通用的未来前进。

附上部分参考资料地址：

https://www.theinformation.com/articles/inside-openais-rocky-path-gpt-5

https://www.theinformation.com/articles/openais-gpt-5-shines-coding-tasks

https://www.businessinsider.com/openai-ceo-sam-altman-teases-gpt-5-2025-8

https://www.theverge.com/notepad-microsoft-newsletter/712950/openai-gpt-5-model-release-date-notepad

https://www.wired.com/story/anthropic-revokes-openais-access-to-claude/

https://www.zdnet.com/article/this-one-feature-will-make-gpt-5-a-game-changer-if-openai-gets-it-right/

https://www.zdnet.com/article/openai-teases-imminent-gpt-5-launch-heres-what-to-expect/

上一篇：ChatGPT Study“出圈”背后：AI教育能否取代传统教师？

下一篇：具身智能，正在翻越三座大山

返回列表

GPT-5 的核心升级，统一了基础和推理模型

发布、版本与最后的悬念

挑战不断，GPT-5 艰难的诞生背景

近期奥特曼的「凡尔赛」时刻

相关新闻