AI亲自设计! OpenAI首款自研AI芯片“Jalapeño”亮相
3 小时前 / 阅读约6分钟
来源:集微网
OpenAI推出自研芯片Jalapeño,专为大模型推理设计,9个月完成开发,刷新ASIC开发周期纪录。芯片由AI参与设计,推理成本有望降低,改善用户体验,OpenAI旨在成为全栈AI公司。

OpenAI 掏出了史上第一颗自研芯片,名字叫 Jalapeño,墨西哥辣椒,专为大模型推理设计。

9 个月前,白纸一张。 9 个月后,工程样片不仅跑通了 GPT-5.3-Codex-Spark,而且频率和功耗均已达到量产目标。

更离谱的是,这颗芯片是 OpenAI 用自己的 AI 帮着画的。

Jalapeño,墨西哥辣椒里辣度最温和的品种之一。 OpenAI 拿它给第一颗芯片命名,潜台词很可能是:这只是入门级,后面可能还有更辣的。

官方定位叫“Intelligence Processor”,一颗专为大模型推理设计的定制 ASIC。

由 OpenAI 主导架构设计,Broadcom 负责芯片实现和网路互联,Celestica 做板卡和机架整合。

通常来说,先进半导体产业,设计一颗高性能 ASIC 要 18 到 24 个月。 Google TPU 两年一代,Amazon Trainium 差不多也是这个节奏。

而 OpenAI 只用了 9 个月,一举刷新了先进半导体领域最快的 ASIC 开发周期。

这颗芯片从第一根线开始就只为一件事优化:LLM 推理。而且,Jalapeño 不只跑 OpenAI 自家模型,架构上兼容全产业的 LLM。

比性能更值得关注的,是这颗芯片怎么被造出来的。 OpenAI 自家 AI 模型参与了这颗芯片的设计和优化。也就是说——AI 设计了一颗芯片,芯片反过来跑 AI,跑在上面的更强 AI 会设计下一代更强的芯片。

AI,帮自己造了一副新身体。

AI 设计芯片并不新鲜。 Google 2021 年在 Nature 发表论文,用强化学习做芯片布局,速度比人类快几个数量级。

此后 AlphaChip 连续优化了三代 TPU 布局方案。 OpenAI 硬体团队的掌门人 Richard Ho,正是从这个圈子里走出来的。

Google 近九年,TPU 高级工程总监,参与发明了 ML 设计芯片架构的方法,多个 TPU 专案首次流片即成功。

之后去了光子计算公司 Lightmatter 担任高级副总裁,更早联合创办过 EDA 公司 0-In Design Automation。学术界、芯片设计、AI 硬体,整条路走了一遍。

OpenAI 挖他来,大概率就是为了一件事:把“AI 辅助芯片设计”嫁接到自家模型上。

芯片设计最磨人的不是“想方案”,而是无数次的设计—验证—修改—再验证循环。一颗先进芯片的验证要跑成千上万次,占掉整个周期的大半时间。

AI 恰恰擅长做这种事——读取历史设计资料、生成 RTL 程式码、辅助验证与除错、优化布局布线。

能实现 9 个月流片,靠的是 AI 替人扛掉了那“18 到 24 个月”里最磨人的一大块。

用最会用锤子的人,来设计新锤子。用最懂 LLM 运行规律的模型,来设计专门跑 LLM 的硬体。

你的 ChatGPT 帐单正在被重写

OpenAI 每年算力支出高达百亿美元级别,这些钱最终都要从你身上赚回来——20 美元月费、API 调用、Plus 和 Pro 订阅。

推理成本砍半,普通用户最先感受到的是:回应速度变快。

现在 ChatGPT 高峰期排队、转圈、长对话变慢,本质都是算力不够分。

推理效率提升后,同等服务器能服务更多用户,使用体验有望改善。

其次:免费版能力有望开放更多功能。现在很多功能锁在 Plus 里——深度研究、高级资料分析、完整版语音对话。

成本降低后,这些功能下放给免费用户的可能性就更高。而 OpenAI 需要的,正是让更多人用上 ChatGPT,而且能用得更久。

再往远看:20 美元的月费可能还是 20 美元,但你拿到的东西将完全不同。

去年这个价格买到的是 GPT-4o,明年同样的钱,可能买到的是一个能跑完整工作流程的 Agent。

月费没变,能力却可能翻好几倍——推理成本下降带来的是一种“隐性降价”。

但 Jalapeño 瞄准的不只是今天的 ChatGPT。

Richard Ho 的思路是:为模型未来要去的方向设计硬体,而不是为它现在的样子设计。

OpenAI 内部能看到未来 6 到 9 个月模型的演进方向,因此芯片也沿着这条路线提前打造。

等 Agent 真正普及后,算力需求和今天的一问一答将完全不是同一个量级。

说白了,推理成本降下来,受益的不只是 Pro 用户。学生、小企业、独立开发者,都可能用上今天只有大型客户才负担得起的 AI 能力。

模型自己训练,芯片自己设计,推理自己优化,部署自己控制。换句话说,OpenAI 要做的是一家全栈 AI 公司。

之前和 Cerebras 合作推理部署,OpenAI 已经摸清专用推理硬体的价值。现在自己下场打造,把经验变成可自主掌控的平台。

Apple 和 Google 都走过这条路。但 OpenAI 的全栈策略又多了一层:用 AI 加速 AI 基础设施建设,再用更好的基础设施跑更强的 AI。如果这个循环成立,飞轮就会自己推动自己加速。

首批 GW 级数据中心将与 Microsoft 等合作伙伴自 2026 年底开始部署。

Jalapeño 只是第一代,下一代叫什么还不知道。但打造它的,高机率不再只是人类。