OpenAI用一颗“辣椒”背刺盟友英伟达,最爽的却是美光科技们?
2 小时前 / 阅读约10分钟
来源:36kr
OpenAI推出Jalapeño芯片,采用ASIC架构,性能或接近Google第八代TPU。OpenAI与英伟达存在矛盾,云服务商试图削减对英伟达依赖。ASIC芯片开发成本高,但划算。HBM内存短缺或持续。

OpenAI的芯片终于与大家见面了,只是亮相的场合有点让人意外:萨姆·奥尔特曼与博通总裁兼CEO陈福阳一起捧着一块标准的12英寸晶圆,底座上印着芯片的名字:Jalapeño。

Jalapeño原意是墨西哥辣椒,雷科技(ID:leitech)最初并没有深想这个名字,直到看完一个分析视频时才突然想到:这个词有点耳熟。

努力回想后,我想起自己第一次听到这个词,是作为雷科技MWC报道团成员,在巴塞罗那MWC会场的小食摊上买了一个taco时。当时我因为那股酸爽带劲的辣味,问摊主那是什么辣椒,得到的答案就是——Jalapeño。

Jalapeño的特点是带劲却又平易近人(这也是它随着西班牙文化而风靡全球的原因),或许也代表着OpenAI这款芯片的特点:性能足够强,且性价比十足。

好了,闲聊先暂告一段落,让我们来审视一下这块芯片。

Jalapeño,OpenAI向英伟达发了一张宣战贴

说实话,OpenAI对Jalapeño的实际参数、制程等信息目前都还在“严防死守”,只是非常笼统地说:它是目前同规格里最强的,已经在实验室里跑通了GPT-5.3-Codex-Spark。

这个模型可能大家接触得不多,实际上是OpenAI专为实时编程需求训练的小型Codex模型,对芯片的需求是“低延迟、高并发”,而非绝对性能。再结合Jalapeño所采用的ASIC架构,基本上可以猜测其性能应该落在Google的第八代TPU芯片附近。

如果我们按第八代TPU中最高性能的TPU 8t(12.6PFLOPS)来算,那么Jalapeño的理论算力或许会在13PFLOPS左右(仅猜测)。但是,如果从Jalapeño的推理用途出发,雷科技推测它的算力更有可能落在10PFLOPS附近,毕竟要兼顾效率和功耗。

图源:Google

考虑到Jalapeño从宣布研发到流片成功仅花费9个月,这个速度和成果确实都足以让人感到惊讶。不过,看看站在奥尔特曼身边的陈福阳,这个“奇迹”倒也不难理解,毕竟博通本就是ASIC领域的巨头之一,算是让OpenAI也体验了一回“站在巨人肩膀上”的感觉。

不过,相比起研发速度,更让雷科技好奇的是:OpenAI真的做好量产准备了吗?从目前已经透露出的消息来看,Jalapeño大概率会由台积电负责生产。

众所周知的是,台积电现在并没有太多空余产能,想要部署一个足以支撑OpenAI算力需求的数据中心,至少短时间内是不可能的。所以,对于一些媒体吹嘘Jalapeño即将拉爆英伟达之类的言论,大家看看就好。

即使按照OpenAI的计划,Jalapeño的部署周期也将延续到2029年,最终目标是建设一个10GW级别的算力中心。

从微软的Azure Maia 200到Google的第八代TPU,从亚马逊的Trainium3到阿里云的真武M890,这些产品背后,是曾经追在英伟达后面、渴求一张显卡的云服务龙头们。如今,它们都在自己“造芯”,现在就连英伟达“最亲密的战友”OpenAI也掏出了Jalapeño。

图源:阿里云

众叛亲离?暂时还说不上,但举目四望、心生茫然肯定是有的。

于是又回到了一个问题上:为什么大家都想跳出英伟达的硬件生态,搭建自己的算力生态?答案自然是成本。

具体分析,小雷在前两天发的《Google开卖TPU,大厂想要靠AI芯片生产“低价token”》一文中已经写过,有兴趣的朋友可以去看看。

不想去看的,记住这段话就行了:英伟达挟天子(GPU+CUDA)以令诸侯,AI巨头们“苦英伟达久矣”。

被英伟达拧巴地投资后,OpenAI不装了

其实,OpenAI与英伟达的矛盾并非现在才显现,如果大家还记得的话,在去年9月,市场盛传英伟达将对OpenAI进行一笔规模巨大的战略投资,其金额可能高达1000亿美元。

大家不妨算算时间,是不是正好是9个月前?换言之,当时的Jalapeño可能已经进入实质启动阶段。从这个角度来看,OpenAI的离职高管们对奥尔特曼的评价倒也没错:政治手腕高超、商业利益至上,对绝对控制权有执念。

图源:维基百科

一边在谈判一笔史上最大的投资计划,一边却计划给对方来一招“釜底抽薪”。虽然很难用“道德”去衡量这种商业行为,但在英伟达眼里,必然会有一种自己受到背叛的感觉,以至于这个千亿投资计划在谈判数月后都没有太多进展。

直到市场因为双方合作出现危机,而对AI行业的未来感到不安时,双方才出于对未来市场的考量,选择敲定一笔300亿美元的投资,而且英伟达只是作为三大投资商之一参股,甚至不是出钱最多的(亚马逊投了500亿美元)。

而在这笔投资敲定后,黄仁勋也公开表示:“这可能是最后一次”。显然,彼时的英伟达有可能已经从供应链收到了消息,OpenAI正在开发Jalapeño,并且已经接近流片或处于流片阶段。

自己投的钱或许会成为日后攻击自己的武器,这个滋味想必是不好受的。但是英伟达与OpenAI的绑定又太深了,双方都需要对方搭台子把“AI”这场大戏继续唱下去,所以双方都处于“谁也离不开谁”的状态。

即使OpenAI有了Jalapeño也是如此,甚至可以说:只要Claude、DeepSeek、Gemini等AI模型还存在,那么OpenAI就离不开英伟达,因为它仍然需要最强的算力卡,去搭建最强的算力矩阵,用来训练“最强”的模型。

但除此之外,所有云服务商都会有意识地削减对英伟达算力卡的依赖,这既可以说是为了利益,也可以说是为了让AI的未来不会被掌控在一家厂商手上。

ASIC让闪存厂商们迎来“第二春”

从OpenAI到阿里云,都在捣鼓ASIC芯片,估计有读者想问:ASIC到底是什么?AI行业要抛弃GPU了吗?

简单来说,ASIC是“专用集成电路”的简称,并非某种固定结构,其设计目的就是根据企业的需求完全定制一颗芯片,而这颗芯片也仅适用于某类特定场景。所以,ASIC芯片的灵活性远不如GPU、CPU这样的通用型芯片,当模型架构发生大幅变化后,企业也往往需要设计新的ASIC芯片,以确保效率。

这也是前面说大家其实都离不开英伟达的原因,因为只有GPU这样的通用型芯片才能同时承载多种不同架构的模型,并且依然保持较高效率运行,而ASIC则更像是你摸透了模型的需求后,针对性打造的“专用工具”。

事实上,每一代ASIC芯片的开发费用和耗时都不低,OpenAI的9个月在半导体行业中已经算得上是奇迹了。即便如此,对于云服务商们来说也是划算的,因为他们自己就能消化大批出货,通过规模效应来均摊单片成本,再算上后期维护等成本,终归是赚的。

有意思的是,在写这篇稿子的时候,恰逢半导体股连续暴跌后的回调,也让不少人坐了一回“心理过山车”。前几天的暴跌其实并不难理解。连日暴涨让美光等企业的股价已经达到前所未有的水平,与此同时,美光还宣布暂缓HBM内存的产能升级计划,将部分产能回调到GDDR等消费级产线。

图源:百度股票

这让部分投资者认为HBM带来的增长神话即将破灭,AI行业的算力硬件前景预期下跌,再叠加其他因素,最终导致半导体企业的股价集体迎来一波暴跌。

然后美光发布的财报,让跳水的股价来了一波“原地起飞”。

事实上,如果你了解目前的AI芯片状态,那么大概率不会怀疑存储厂商的未来营收(仅分析,不构成投资建议)。因为不管是英伟达的算力卡,还是各个公司自己开发的ASIC芯片,只要是用于高并发、高吞吐、低延迟的推理场景,那么HBM内存几乎是目前唯一的选择。

这种情况会持续到突破性技术出现为止,比如Wafer-Scale架构彻底成熟、片上大SRAM设计(在芯片中内置大容量高速内存)完全跑通等。目前来看,以上技术虽然都取得了一定进展,但是距离完全成熟还有一定时间。

真要说的话,目前最有可能出现的“黑天鹅事件”,是某个AI厂商突然宣布研发出一套全新的算法,可以让AI模型对存储的需求大幅度降低。比如前段时间Google公开的TurboQuant,据称可将推理内存需求降低6倍以上。虽然其论文结论尚存争议,但如果该技术成熟,将会对HBM的需求造成直接冲击。

除此之外,DeepSeek的MoE路由优化、MLA路线,以及针对特定内存技术开发的新型模型结构(比如大小模型混合调度),都是可预期的方向。这也是存储企业其实不太喜欢DeepSeek的原因,因为他们真的是在“捣乱”。

不过,至少在未来的两三年里,内存的短缺可能仍难以缓解。

反而会因为芯片厂商们都在折腾自己的ASIC芯片(单颗芯片往往需要128GB以上的HBM内存),导致HBM供需进一步紧张。

写在最后

未来几年,AI行业大概会变得更加“火热”,因为目前的投资额,已经让大家都无法承担失败的后果。

所以,英伟达的GPU神话大概率仍会继续,HBM的缺货周期还远未结束,ASIC的战争其实才刚刚开始。而消费者最终看到的,可能是一边越来越便宜的AI服务,另一边却是越来越贵的显卡、内存、SSD与电子产品。

这么看来,Jalapeño这个名字是真的起得妙:它不像死神辣椒那样一口封喉,却足够让整个AI芯片市场感到火辣。

AI公司的目标是让token变便宜。但在那之前,先被点燃的,可能是整个半导体产业链。