北京时间 2026 年 6 月 25 日 — OpenAI 于北京时间 6 月 25 日正式对外发布其首款自研 AI 推理芯片,命名为 Jalapeño(哈拉贝诺辣椒)。该芯片由 OpenAI 与半导体巨头博通(Broadcom)联合开发,专为大语言模型推理场景而设计,将用于驱动 ChatGPT、Codex、API 接口及未来各类智能体产品的服务器端计算。

九个月完成从设计到流片,刷新行业纪录
最令外界震惊的,是这枚芯片的开发速度。OpenAI 在官方公告中称,Jalapeño 从初始设计到制造流片(tape-out)仅用了九个月,自称是"高性能先进半导体领域有史以来最快的 ASIC 开发周期"。要知道,传统高性能芯片的设计周期通常需要两到三年。而这一速度之所以得以实现,很大程度上要归功于 OpenAI 自家的 AI 模型——ChatGPT 在芯片的设计过程中发挥了辅助作用,加速了工程迭代与验证。OpenAI 将此称为"AI 辅助造芯",并援引称:"如果 AI 能帮助工程师更快地设计出更好的芯片,就可以降低整个行业的计算成本,帮助普及先进 AI 的使用权限。"
专注推理,而非训练
Jalapeño 是一枚 ASIC(专用集成电路),功能定位非常明确:服务于 AI 推理(inference)而非训练(training)。推理,是指模型响应用户请求、实时生成内容的过程;而训练则是模型消化海量数据形成能力的一次性阶段。这一取舍看似低调,却有着清晰的商业逻辑——训练是一次性的资本投入,而推理是每天数亿用户持续产生的成本大头。若能将推理成本压降三到五成,在 OpenAI 的规模下,节省的将是天文数字的利润空间。
OpenAI 表示,虽然芯片仍在测试阶段,但早期测试结果显示,Jalapeño 的每瓦性能(performance-per-watt)将明显优于当前最先进的同类产品。博通 CEO 陈福阳(Hock Tan)在接受路透社采访时更直接表示,该芯片的性能可与英伟达 Blackwell 系列及谷歌张量处理器(TPU)相媲美。OpenAI 计划在 2026 年底前完成部署,并将其定位为"多代计算平台的第一步"。
战略意图:向全栈掌控迈进
这枚芯片的发布,背后是 OpenAI 一场系统性的战略布局。长期以来,OpenAI 高度依赖英伟达 GPU,而在 AI 基础设施资源普遍供不应求的当下,这种依赖正成为公司成本与扩张能力的双重制约。OpenAI 总裁格雷格·布罗克曼(Greg Brockman)此前在公司播客中阐述了其芯片开发思路:"我们对自己的工作负载有深刻理解,一直在寻找那些需求尚未被充分满足的特定场景,思考如何针对性地构建加速能力。"
OpenAI 在公告中明确表达了全栈掌控的雄心:"OpenAI 不仅在开发前沿模型,也在构建其上的产品;更重要的是,我们正在设计它们之下的基础设施——包括芯片架构、内核、内存系统、网络、调度、部署系统乃至产品体验。因为 OpenAI 贯穿整个技术栈,每一层都可以围绕同一个目标进行优化:让我们的模型对用户而言更快、更稳定、更实惠。"
值得关注的是,OpenAI 与博通的合作早在 2025 年 10 月便已官方宣布,而有关 OpenAI 自研芯片的传闻则更早就在业界流传。此前 OpenAI 曾与 AI 芯片公司 Cerebras 有过接触,也正是从中积累了宝贵的定制芯片认知。
行业背景:巨头纷纷"去英伟达化"
Jalapeño 的亮相,是科技巨头推进 AI 芯片自研浪潮中的最新一笔。谷歌早已推出 TPU 系列、亚马逊有 Trainium、微软与 Meta 也相继发布了专属 AI 加速芯片。尽管这些自研芯片在整体性能上与英伟达仍有差距,但在特定推理场景下的能效优势正在不断收窄。
从更宏观的视角来看,"AI 造芯片、芯片跑 AI"这一自增强循环一旦成熟,整个半导体行业的迭代节奏将被彻底重塑。Jalapeño 的九个月开发周期,或许只是一个开始。