OpenAI只用了9个月造出一颗芯片，行业平均要3年，英伟达真的开始慌了 - 芯片

Just Quick Just Quality

热门话题

白天

搜索

资讯

OpenAI只用了9个月造出一颗芯片，行业平均要3年，英伟达真的开始慌了

3 小时前 / 阅读约6分钟

来源：凤凰网

OpenAI仅用9个月完成芯片Jalapeño从设计到出片，定位为大模型推理专用，通过AI参与设计及架构优化降低成本，推理成本降低将提升用户体验，首批部署定于2026年底。

9个月。

从一张白纸到芯片出片，OpenAI只花了9个月。这个行业正常走路，要两到三年。

这颗让全行业侧目的东西叫Jalapeño——墨西哥辣椒里辣度最温柔的一个品种。名字起得谦虚，事情做得一点都不客气。

6月24日，博通CEO陈福阳亲手把工程样片递到了Sam Altman手上。OpenAI，正式拿到了芯片俱乐部的入场券。

真正让业内坐不住的，不是这颗芯片跑分多高——实际上详细的技术报告还没公开。而是另外两件事：它是怎么来的，以及谁因此睡不着觉。

不练模型，只跑推理

别把Jalapeño当成通用GPU的替代品。它不负责训练模型。

它只有一件差事：当用户给ChatGPT发消息、让Codex改bug、请AI助手跑长任务的时候，在服务器那头用最低的功耗把推理算完。

听起来不如"训练芯片"热闹，但OpenAI的财务部门可是心里门儿清。训练砸一笔大钱也就结束了，推理却是每天汹涌几十亿次请求，电费、服务器折旧，没完没了。So，谁能把推理成本打下来，谁就能真正赚钱。

OpenAI给它的定位叫"Intelligence Processor"——智能处理器，而非行业惯用的"AI加速器"这个词——就是想说明这不是一个啥都能干的通用芯片，是专门为大模型推理从头设计的。

架构上三件事贯穿了全部设计：砍掉冗余的数据搬运、让计算与内存及网络的资源配比重新平衡、把实际有效利用率顶到离理论天花板最近的地方。

通俗讲就是——通用GPU跑AI时很多算力耗在了数据搬来搬去上，Jalapeño从架构层面解决了这个问题。

AI画了张电路图，给自己造了副身躯

一颗高端定制ASIC，从架构设计到送厂流片，18个月算快的。谷歌TPU两年一代，亚马逊Trainium也差不多。9个月是破纪录的速度。

关键因素有两个。

第一，AI参与了芯片设计。

芯片设计最耗时的环节不是构思方案，是验证——设计、仿真、debug、改、再仿真，反复成千上万轮，吃掉一半以上的开发时间。而AI恰恰擅长这种活：读历史设计数据、辅助写RTL代码、在验证阶段帮忙排查问题、参与布局优化。OpenAI在公告里明确说了，自家模型在加速设计流程上的表现"超出预期"。

这就形成了一个闭环：AI帮忙画芯片，芯片造出来跑AI，更强AI下次画更好的芯片。

第二，带队的人。

OpenAI硬件团队由Richard Ho领导。他在谷歌待了将近九年，是Cloud TPU的核心工程负责人，带着多代TPU从概念走到了量产。之后去了光子计算公司Lightmatter做高级副总裁，再早还联合创办了EDA公司0-In Design Automation。芯片设计、AI加速、光互联，三个领域全干过。

分工很明确：OpenAI管架构和内核，博通负责硅片实现和Tomahawk网络交换芯片，天弘科技Celestica做板卡和系统集成，台积电3nm制程制造。

英伟达看着客户名单，客户在另起炉灶

Jalapeño的意义比一颗芯片本身重得多。

拉一条时间线：2016年，谷歌率先发布TPU，当时英伟达GPU在AI训练圈几乎无人能敌。2018年，亚马逊端出推理芯片Inferentia，四年后又加了训练芯片Trainium。2023年，身为OpenAI第一大投资方和算力供应商的微软，自己下场亮了Maia。今年4月，路透社挖出Anthropic也在琢磨自研。

到6月24日，OpenAI把Jalapeño摆上桌面，圈子又扩了一个。

你把这串名字连起来读——谷歌、亚马逊、微软、Meta、OpenAI、Anthropic。每一个都曾是英伟达最舍得掏钱的座上宾，每一个都在暗处建起了自己的芯片工事。

Greg Brockman在发布声明中说得直截了当："世界正在迈向算力驱动的经济。"

如果算力变成了和石油一样的基础资源，谁会把阀门全交给同一家供应商？

20美元月费买到的，可能翻倍

这件事的最大受益者不是投资人，不是技术极客，是每一个掏20美元开ChatGPT Plus的人。

推理成本砍下去，第一个直觉体感是速度快了。高峰期卡顿、排队转圈、聊久了越来越慢——这些毛病的根子全在推理算力不够分。同样规模的服务器集群，换上效率翻倍的芯片，吞吐用户的能力就翻倍。

再往下推一层，免费版的边界会被拓宽。现在深度研究、高级数据分析、完整版语音对话都锁在Plus里，不是因为功能本身成本高，而是给免费用户放开之后的算力账单吃不消。成本降下来，这道算术题的答案就变了。

而最隐蔽的变化不在价格标签上。20美元可能还是20美元，但你买到的东西完全不一样了——去年花这个钱只拿到一个GPT-4o，明年同样的钱可能到手的是一个能自主跑完整工作流的agent。月费不变，能力翻倍，这本质上就是推理成本降价带来的隐性赠送。

但Jalapeño瞄准的远不止现在的ChatGPT。

Richard Ho的思路是，芯片要按模型未来6到9个月的发展方向提前造。等agent产品真上了量，每次交互的算力消耗和今天一问一答完全不在一个量级。基础设施不提前准备，最致命的地方就会卡脖子。

从硅片到按钮，OpenAI想全捏在自己手里

OpenAI在公告里的表述很直白。

大意是：我们不仅在开发最前沿的模型，不仅在模型上面搭产品，我们还在设计模型底下的每一层——芯片架构、内核、内存系统、网络、调度、部署体系。

从硅片到用户指尖点下去的按钮，每一段链路都想自己控盘。

这套思路苹果走过，谷歌也走过。但OpenAI比它们多了一层——让AI参与建基础设施，再用更强的基础设施跑更强的AI。如果这个飞轮真的转顺了，它会自己踩油门。

首批部署定在2026年底，与微软等伙伴在吉瓦级数据中心落地。芯片和配套服务器不外卖，纯自用。博通CEO陈福阳在接受采访时甚至说，2027年1.3吉瓦的部署预测都偏保守了，需求远远跑在前面。

Jalapeño只是第一代。下一代叫什么还没人知道。

但设计它的，大概率不会再只是人了。

上一篇：OpenAI 博通联手发芯片，黄仁勋还能保持松弛吗？

下一篇：美光：牛气冲天，“凄凉周期”要变“超级成长”？

返回列表

相关新闻