OpenAI自研芯片Jalapeño：AI帮自己造了副新身体，9个月流片，你的ChatGPT账单要被重写了？

TL;DR

OpenAI掏出了第一颗自研推理芯片“Jalapeño”，9个月就完成流片，刷新了半导体行业纪录。更离谱的是，这芯片是自家AI帮着画的——AI设计芯片，芯片跑AI，更强的AI再设计下一代芯片。推理成本预期砍半，你的ChatGPT月费可能不变，但能用的功能可能要翻几倍。

就在刚刚，OpenAI搞了个大新闻——史上第一颗自研芯片，名字叫Jalapeño（墨西哥辣椒里最温和的那种），正式亮相。

别被这“温和”的名字骗了。9个月前，它还只是一张白纸；9个月后，工程样片已经稳稳跑起了GPT-5.3-Codex-Spark，频率和功耗全部达标量产目标。用官方的话说，这是高性能先进半导体领域有史以来最快的ASIC开发周期——Google TPU两年一代，Amazon Trainium差不多也是这节奏，而OpenAI只用了9个月，直接把行业纪录给碎了。 ¹

而且，这颗芯片是AI帮着画的。

AI设计芯片，芯片跑AI，然后AI自己升级

芯片设计最磨人的不是“想方案”，而是设计→验证→改→再验证的无限循环。一颗先进芯片的验证要跑成千上万次，占掉整个周期的大半时间。

OpenAI的做法很“自己人”：让自家AI模型直接参与设计和优化。读历史设计数据、生成RTL代码、辅助验证和debug、优化布局布线……AI替人扛掉了那“18到24个月”里最磨人的一大块。

于是出现了这个闭环：AI设计了一颗芯片 → 芯片反过来跑AI → 跑在上面的更强AI会设计下一代更强的芯片。AI，帮自己造了一副新身体。

带队干这件事的Richard Ho，正是从Google AlphaChip那个圈子里走出来的——Google近九年TPU高级工程总监，参与发明了用机器学习设计芯片架构的方法，多个TPU项目首次流片即成功。OpenAI挖他来，大概率就是为了一件事：把“AI辅助芯片设计”嫁接到自家模型上。 ²

这颗芯片到底有多“辣”？

Jalapeño虽然名字温和，但性能可不温和。官方定位叫Intelligence Processor，一颗专门为大模型推理设计的定制ASIC。

早期测试数据显示，它的每瓦性能“大幅优于当前最先进水平”，博通CEO陈福阳直接放话——相比典型的AI图形处理单元，能节省约50%的成本。 ¹

而且，它不只跑OpenAI自家模型，架构上兼容全行业的LLM。从第一根线开始就只为一件事优化：LLM推理。减少数据移动，算力、内存和网络资源之间达到均衡，让实际利用率更接近理论峰值。

更重要的是，这颗芯片不是展示品——2026年底开始吉瓦级部署，微软等合作伙伴的数据中心会先上。博通CEO还透露，下一代计划2028年推出，随后每年发布一代。 ¹

你的ChatGPT账单正在被悄悄重写

推理成本砍半意味着什么？

你先感受到的可能是：响应变快。现在高峰期排队、转圈、长对话变慢，本质都是算力不够分。推理效率提升后，同等服务器能服务更多用户，体验自然改善。

其次：免费版能力可能放开。现在很多功能锁在Plus里——深度研究、高级数据分析、完整版语音对话。成本降了，这些下放给免费用户的可能性就大了。

再往远看：20美元的月费可能还是20美元，但你拿到的东西完全不一样。去年这个价格买到的是GPT-4o，明年同样的钱可能买到的是一个能跑完整工作流的agent。月费没变，能力可能翻几番——推理成本下降带来的隐性降价。

而且Jalapeño瞄准的不只是今天的ChatGPT。Richard Ho的思路是：为模型要去的方向设计硬件，而不是为它现在的样子。等agent真正跑起来，算力需求和今天的一问一答完全不是一个量级。学生、小企业、独立开发者，都可能用上今天只有大客户才跑得起的AI能力。

Open AI要做全栈AI公司，吃掉整条链

模型自己训，芯片自己设计，推理自己优化，部署自己控制。

Apple和Google都走过这条路。但OpenAI的全栈多了一层：用AI加速AI基础设施建设，再用更好的基础设施跑更强的AI。

这个飞轮一旦转起来，会自己给自己加速。首批GW级数据中心将和微软等合作方从2026年底开始部署。Jalapeño只是第一代，下一代叫什么还不知道——但造它的，大概率不只是人了。

所以，这颗“温和的墨西哥辣椒”，也许就是AI世界开始自造身体的第一口。

OpenAI自研芯片来了！每瓦性能超先进水平成本还能节约50%·财联社·（2026/6/25）·检索日期2026/6/25 ↩︎ ↩︎ ↩︎
OpenAI发布首款定制AI推理芯片，披露多代计算平台计划·搜狐网·（2026/6/25）·检索日期2026/6/25 ↩︎