三年前,ChatGPT横空出世。
第一次感受到透骨恐惧的谷歌,仓促拉响了「红色警报」。

但谁能想到,仅仅三年,这个「红色警报」竟在OpenAI自己家里炸响!
CEO奥特曼紧急发布全员信,字里行间只有一句:
ChatGPT,危在旦夕。

奥特曼:We are at a critical time for ChatGPT
这一次,轮到OpenAI了。
据奥特曼透露,下周,OpenAI计划发布一款全新的推理模型。
内部评估显示,这个模型在性能上要比Gemini 3更强,但在改善ChatGPT的「体验」方面还有更多工作要做。
不仅如此,Inforamtion最新爆料称,OpenAI还在研发新一代模型,内部代号「Garlic」(大蒜)。

「Garlic」在预训练方面,实现了重大突破。
它修复了GPT-4.5早期结构中的问题,预计明年初作为GPT-5.2/GPT-5.5发布。
至少在内部公测中,「Garlic」在编码和推理任务上,比谷歌Gemini 3、Claude 4.5 Opus更胜一筹。
上一周,首席研究官Mark Chen向内部团队做了闭门分享,核心就一句话:「Garlic」准备好了!
昨天一次访谈上,Mark Chen公开回应,Gemini 3是一款强大模型,但OpenAI已有与之实力相抗的模型。
由此来看,OpenAI早已悄悄把下一张王牌攥在了手里。
Mark Chen在内部的原话是:
我们打算尽快发布Garlic的某个版本。以目前的进度,明年初就能看到GPT-5.2或GPT-5.5发布,大家也不必感到惊讶。
此前,不仅Information,还有SemiAnalysis多家外媒爆出,自GPT-4o之后,OpenAI尚未完成下一代前沿大模型的预训练上。
因为这些挑战,OpenAI才不得已将重心转向了——推理模型。

10月,奥特曼曾向全员保证,OpenAI将发布代号为「Shallotpeat」的新大语言模型,来应战谷歌Gemini 3。
显然,「Garlic」和「Shallotpeat」是两款不同的模型。
前者整合了在开发「Shallotpeat」期间修复的Bug,最关键的突破发生在「预训练阶段」。
众所周知,谷歌在Gemini 3上最大的底气,就是在预训练阶段实现了「质的飞跃」。
就连OpenAI高层,也在私下承认了这一点。
不过,在「Garlic」开发过程中,OpenAI解决了此前预训练环节遇到的一些关键问题——
改进之前「最好的」且「体量大得多」的预训练模型。
也就是,今年2月发布后,便如昙花一现、如今已没什么存在感的GPT-4.5。
本质上,这些优化可以让OpenAI将同样海量的知识注入到一个更小的模型中。而以前,只能通过开发巨量模型,来实现。
不用说,开发大模型肯定比开发小模型更烧钱、更耗时!
Mark Chen还透露一个更炸裂的消息:
凭借着「Garlic」的经验积累,OpenAI已悄然启动下一代更大、更强的模型了。
这两周,AI圈的风向都吹向了谷歌,OpenAI罕见地陷入了被动「追赶着」的角色。

Gemini 3发布两周后,ChatGPT日活跃用户下降了6%
在扳回一局之前,OpenAI必须拉响「红色警报」!
几周前,为了改进ChatGPT,OpenAI曾宣布进入了「橙色警报」状态。
如今的如今,一切更加紧迫了。

随着Code Red的发布,那些曾经排期在前的项目都被推迟了。
广告业务:本来想开始通过搜索赚钱的,先放放。
AI智能体:那种能帮你自动买票、挂号的全能助手,先等等。
Pulse:本来打算每天早上给你发个性化新闻早报的产品,也砍掉了。
目的很简单。
就是用手头上所有的算力、人力和财力,去服务一件事:
让现在的ChatGPT变得更好。
为什么要如此大动干戈?
因为OpenAI发现,原本看起来不可逾越的领先优势,正在被对手一点点蚕食。
1. 增长似乎没以前那么猛了:
CFO在与投资人的电话会议中暗示:ChatGPT的某些增长指标在放缓——可能是用户数、使用时长、订阅数,等等。

2. 谷歌的反击,越来越有威胁:
强大的新一代模型吸引力十足,不管是用户还是开发者,都不再只盯着OpenAI一家。
在搜索中加入的「AI模式」,让搜索这件事变成了像是和「AI聊天」一样。
种种因素叠加之后,Gemini的月活用户也从7月的4.5亿,飙升到了10月的6.5亿。

奥特曼发内部信,警告道:谷歌在AI领域的卷土重来,可能会给OpenAI带来「暂时性的经济逆风」
3. 要烧的钱,实在太多了:
未来几年,为了训练更强模型+支撑ChatGPT跑起来,OpenAI要烧掉数百亿美元。
反过来,ChatGPT订阅带来的收入预期是:今年约100亿美元,明年200亿,2027年350亿。
因此,为了给这场「烧钱长跑」续命,OpenAI希望能够再融差不多1000亿美元。
但成功与否,就得看ChatGPT的表现如何了。
总结来说,在这样的背景下,任何增长放缓、用户流失,都会被放大成「生死问题」。
1. 用户量追逐战
OpenAI表示,ChatGPT目前承担了全球70%的「AI助手活动」和10%的「搜索活动」。
谷歌则展示Gemini的快速增长,把它深度整合到自家搜索和产品矩阵里。

2. 生态vs.爆款
OpenAI目前的王牌是:一个极强、极出圈的ChatGPT+一套开发者API。
谷歌拿出的则是:搜索+邮箱+文档+安卓+浏览器+YouTube+…+Gemini,整个生态通通AI化。
在备忘录里,奥特曼重点点了几条「优先级拉满」的方向:
他说要让每周8亿次使用背后的人,感觉这就是「我的ChatGPT」,而不是千篇一律的大众工具:
允许用户定制:它的说话风格、偏好、工作流方式,甚至记住你是谁、你怎么做事。
这和此前提到的「Memory」(记忆功能)一脉相承——AI不只是回答问题,而是长期「认识你」。
现在的ChatGPT,像一个每次见面都要重新自我介绍的前台。
而未来它更像一个长期跟你搭档的助理:记得你做什么工种、你家有几个孩子、你写代码用什么风格、你讨厌什么语气。
这件事,对提高用户黏性非常关键——
当一个工具开始「懂你」,你就不太想频繁换平台了。
图像生成之所以重要,是因为:
很多人可能不会长期用ChatGPT写长文,但会经常来生图;
这是和创作者、设计师、普通用户联结的关键入口;
图像生成模型,也可以反哺很多产品场景(广告设计、电商展示、游戏概念图等)。
最近这段时间,谷歌便是凭借着Nano Banana和Nano Banana Pro断崖式的领先优势,连续数月称霸全球AI圈的热门话题。
所以也不难理解,为何奥特曼会把图像生成能力列为Code Red的重点之一了。

「模型行为」包括几件事:
回答是否准确、有用、少胡说八道;
是否语气舒服,不阴阳怪气、有人味;
是否刚刚好拿捏安全与开放之间的尺度。
而奥特曼想要的,是大幅改善这些「行为」,从而让用户在LMArena这类公开排名里,更愿意选ChatGPT背后的模型,而不是竞品。
因为,这类榜单对开发者和重度用户影响很大,会影响他们选哪个模型来构建自己的应用。

此外,奥特曼还点名了三个优化方向:
回答速度更快
可靠性更高
「过度拒绝」更少
速度方面,不仅用户十分敏感,对于开发者来说更是如此——延迟太高,整个产品的体验就会直接崩盘。
与此同时,「过度拒绝」也是一个非常典型的使用痛点:你明明问的是正常问题,结果AI被风控吓到,动不动就说「对不起,我无法回答这个问题」。
接下来他们要做的是:在安全红线内,尽量减少误伤正常需求。
对于普通用户来说,他们在一个平台上投入的「时间+习惯」,会形成更强的锁定。
未来的ChatGPT,会越来越像「私人AI助理」,而不是公共问答机。它会更了解你的偏好、更会「记事」、更像一个长久陪伴的工具。
体验方面,也会更快、更稳定,以及更少无故被拒。
如果能让用户使用起来更顺手,那么就有机会增加他们对AI的依赖度。也就是,从「偶尔玩玩」变成「每天离不开」。
图像、创意、多模态,会越来越重要。不只是「问答和写作」,而是贯穿「写文+画图+做设计+查资料」的全套流程。
对于行业来说,短期内「卷体验」会比「卷参数量」更重要。
模型参数一再升级,普通用户已经分不清「1万亿参数」和「2万亿参数」的区别了。但是谁打开更快、谁更稳定、谁更懂自己,用户一用就知道。
对于OpenAI来说,这是一次「不一定决定生死、但估值意义极大」的争夺战。
1000亿美元的融资目标、数百亿美元的算力投入,都需要一个强而稳定的现金牛做支撑。
而ChatGPT就是这头牛:不仅要有流量,还要有粘性和付费意愿。

开发者和创业者,则要开始考虑站队哪个「生态大本营」:
如果ChatGPT的体验和口碑继续领先,它会成为大家默认接入的「AI水电站」;
谷歌等如果在某些场景做得更顺滑,势必分走一部分新应用。
总结起来就一句:AI赛道,没有永恒的王座。
仅仅三年前,ChatGPT还是那个把谷歌吓出一身冷汗的「屠龙少年」,如今却在疲于应对来自搜索帝国的凛冽反杀。
不过,这恰恰是普通用户的「时代红利」——他们卷得越凶,我们用得越爽。
千帆过尽,极致的产品体验,才是亘古不变的硬道理。
参考资料:HJY
https://www.theinformation.com/articles/openai-ceo-declares-code-red-combat-threats-chatgpt-delays-ads-effort?rc=epv9gi
