OpenAI只用了9个月造出一颗芯片,行业平均要3年,英伟达真的开始慌了
3 小时前 / 阅读约6分钟
来源:凤凰网
OpenAI仅用9个月完成芯片Jalapeño从设计到出片,定位为大模型推理专用,通过AI参与设计及架构优化降低成本,推理成本降低将提升用户体验,首批部署定于2026年底。

9个月。

从一张白纸到芯片出片,OpenAI只花了9个月。这个行业正常走路,要两到三年。

这颗让全行业侧目的东西叫Jalapeño——墨西哥辣椒里辣度最温柔的一个品种。名字起得谦虚,事情做得一点都不客气。

6月24日,博通CEO陈福阳亲手把工程样片递到了Sam Altman手上。OpenAI,正式拿到了芯片俱乐部的入场券。

真正让业内坐不住的,不是这颗芯片跑分多高——实际上详细的技术报告还没公开。而是另外两件事:它是怎么来的,以及谁因此睡不着觉。

不练模型,只跑推理

别把Jalapeño当成通用GPU的替代品。它不负责训练模型。

它只有一件差事:当用户给ChatGPT发消息、让Codex改bug、请AI助手跑长任务的时候,在服务器那头用最低的功耗把推理算完。

听起来不如"训练芯片"热闹,但OpenAI的财务部门可是心里门儿清。训练砸一笔大钱也就结束了,推理却是每天汹涌几十亿次请求,电费、服务器折旧,没完没了。So,谁能把推理成本打下来,谁就能真正赚钱。

OpenAI给它的定位叫"Intelligence Processor"——智能处理器,而非行业惯用的"AI加速器"这个词——就是想说明这不是一个啥都能干的通用芯片,是专门为大模型推理从头设计的。

架构上三件事贯穿了全部设计:砍掉冗余的数据搬运、让计算与内存及网络的资源配比重新平衡、把实际有效利用率顶到离理论天花板最近的地方。

通俗讲就是——通用GPU跑AI时很多算力耗在了数据搬来搬去上,Jalapeño从架构层面解决了这个问题。

AI画了张电路图,给自己造了副身躯

一颗高端定制ASIC,从架构设计到送厂流片,18个月算快的。谷歌TPU两年一代,亚马逊Trainium也差不多。9个月是破纪录的速度。

关键因素有两个。

第一,AI参与了芯片设计。

芯片设计最耗时的环节不是构思方案,是验证——设计、仿真、debug、改、再仿真,反复成千上万轮,吃掉一半以上的开发时间。而AI恰恰擅长这种活:读历史设计数据、辅助写RTL代码、在验证阶段帮忙排查问题、参与布局优化。OpenAI在公告里明确说了,自家模型在加速设计流程上的表现"超出预期"。

这就形成了一个闭环:AI帮忙画芯片,芯片造出来跑AI,更强AI下次画更好的芯片。

第二,带队的人。

OpenAI硬件团队由Richard Ho领导。他在谷歌待了将近九年,是Cloud TPU的核心工程负责人,带着多代TPU从概念走到了量产。之后去了光子计算公司Lightmatter做高级副总裁,再早还联合创办了EDA公司0-In Design Automation。芯片设计、AI加速、光互联,三个领域全干过。

分工很明确:OpenAI管架构和内核,博通负责硅片实现和Tomahawk网络交换芯片,天弘科技Celestica做板卡和系统集成,台积电3nm制程制造。

英伟达看着客户名单,客户在另起炉灶

Jalapeño的意义比一颗芯片本身重得多。

拉一条时间线:2016年,谷歌率先发布TPU,当时英伟达GPU在AI训练圈几乎无人能敌。2018年,亚马逊端出推理芯片Inferentia,四年后又加了训练芯片Trainium。2023年,身为OpenAI第一大投资方和算力供应商的微软,自己下场亮了Maia。今年4月,路透社挖出Anthropic也在琢磨自研。

到6月24日,OpenAI把Jalapeño摆上桌面,圈子又扩了一个。

你把这串名字连起来读——谷歌、亚马逊、微软、Meta、OpenAI、Anthropic。每一个都曾是英伟达最舍得掏钱的座上宾,每一个都在暗处建起了自己的芯片工事。

Greg Brockman在发布声明中说得直截了当:"世界正在迈向算力驱动的经济。"

如果算力变成了和石油一样的基础资源,谁会把阀门全交给同一家供应商?

20美元月费买到的,可能翻倍

这件事的最大受益者不是投资人,不是技术极客,是每一个掏20美元开ChatGPT Plus的人。

推理成本砍下去,第一个直觉体感是速度快了。高峰期卡顿、排队转圈、聊久了越来越慢——这些毛病的根子全在推理算力不够分。同样规模的服务器集群,换上效率翻倍的芯片,吞吐用户的能力就翻倍。

再往下推一层,免费版的边界会被拓宽。现在深度研究、高级数据分析、完整版语音对话都锁在Plus里,不是因为功能本身成本高,而是给免费用户放开之后的算力账单吃不消。成本降下来,这道算术题的答案就变了。

而最隐蔽的变化不在价格标签上。20美元可能还是20美元,但你买到的东西完全不一样了——去年花这个钱只拿到一个GPT-4o,明年同样的钱可能到手的是一个能自主跑完整工作流的agent。月费不变,能力翻倍,这本质上就是推理成本降价带来的隐性赠送。

但Jalapeño瞄准的远不止现在的ChatGPT。

Richard Ho的思路是,芯片要按模型未来6到9个月的发展方向提前造。等agent产品真上了量,每次交互的算力消耗和今天一问一答完全不在一个量级。基础设施不提前准备,最致命的地方就会卡脖子。

从硅片到按钮,OpenAI想全捏在自己手里

OpenAI在公告里的表述很直白。

大意是:我们不仅在开发最前沿的模型,不仅在模型上面搭产品,我们还在设计模型底下的每一层——芯片架构、内核、内存系统、网络、调度、部署体系。

从硅片到用户指尖点下去的按钮,每一段链路都想自己控盘。

这套思路苹果走过,谷歌也走过。但OpenAI比它们多了一层——让AI参与建基础设施,再用更强的基础设施跑更强的AI。如果这个飞轮真的转顺了,它会自己踩油门。

首批部署定在2026年底,与微软等伙伴在吉瓦级数据中心落地。芯片和配套服务器不外卖,纯自用。博通CEO陈福阳在接受采访时甚至说,2027年1.3吉瓦的部署预测都偏保守了,需求远远跑在前面。

Jalapeño只是第一代。下一代叫什么还没人知道。

但设计它的,大概率不会再只是人了。