TL;DR
OpenAI掏出了第一颗自研推理芯片“Jalapeño”,9个月就完成流片,刷新了半导体行业纪录。更离谱的是,这芯片是自家AI帮着画的——AI设计芯片,芯片跑AI,更强的AI再设计下一代芯片。推理成本预期砍半,你的ChatGPT月费可能不变,但能用的功能可能要翻几倍。
就在刚刚,OpenAI搞了个大新闻——史上第一颗自研芯片,名字叫Jalapeño(墨西哥辣椒里最温和的那种),正式亮相。
别被这“温和”的名字骗了。9个月前,它还只是一张白纸;9个月后,工程样片已经稳稳跑起了GPT-5.3-Codex-Spark,频率和功耗全部达标量产目标。用官方的话说,这是高性能先进半导体领域有史以来最快的ASIC开发周期——Google TPU两年一代,Amazon Trainium差不多也是这节奏,而OpenAI只用了9个月,直接把行业纪录给碎了。 1
而且,这颗芯片是AI帮着画的。
AI设计芯片,芯片跑AI,然后AI自己升级
芯片设计最磨人的不是“想方案”,而是设计→验证→改→再验证的无限循环。一颗先进芯片的验证要跑成千上万次,占掉整个周期的大半时间。
OpenAI的做法很“自己人”:让自家AI模型直接参与设计和优化。读历史设计数据、生成RTL代码、辅助验证和debug、优化布局布线……AI替人扛掉了那“18到24个月”里最磨人的一大块。
于是出现了这个闭环:AI设计了一颗芯片 → 芯片反过来跑AI → 跑在上面的更强AI会设计下一代更强的芯片。AI,帮自己造了一副新身体。
带队干这件事的Richard Ho,正是从Google AlphaChip那个圈子里走出来的——Google近九年TPU高级工程总监,参与发明了用机器学习设计芯片架构的方法,多个TPU项目首次流片即成功。OpenAI挖他来,大概率就是为了一件事:把“AI辅助芯片设计”嫁接到自家模型上。 2
这颗芯片到底有多“辣”?
Jalapeño虽然名字温和,但性能可不温和。官方定位叫Intelligence Processor,一颗专门为大模型推理设计的定制ASIC。
早期测试数据显示,它的每瓦性能“大幅优于当前最先进水平”,博通CEO陈福阳直接放话——相比典型的AI图形处理单元,能节省约50%的成本。 1
而且,它不只跑OpenAI自家模型,架构上兼容全行业的LLM。从第一根线开始就只为一件事优化:LLM推理。减少数据移动,算力、内存和网络资源之间达到均衡,让实际利用率更接近理论峰值。
更重要的是,这颗芯片不是展示品——2026年底开始吉瓦级部署,微软等合作伙伴的数据中心会先上。博通CEO还透露,下一代计划2028年推出,随后每年发布一代。 1
你的ChatGPT账单正在被悄悄重写
推理成本砍半意味着什么?
你先感受到的可能是:响应变快。现在高峰期排队、转圈、长对话变慢,本质都是算力不够分。推理效率提升后,同等服务器能服务更多用户,体验自然改善。
其次:免费版能力可能放开。现在很多功能锁在Plus里——深度研究、高级数据分析、完整版语音对话。成本降了,这些下放给免费用户的可能性就大了。
再往远看:20美元的月费可能还是20美元,但你拿到的东西完全不一样。去年这个价格买到的是GPT-4o,明年同样的钱可能买到的是一个能跑完整工作流的agent。月费没变,能力可能翻几番——推理成本下降带来的隐性降价。
而且Jalapeño瞄准的不只是今天的ChatGPT。Richard Ho的思路是:为模型要去的方向设计硬件,而不是为它现在的样子。等agent真正跑起来,算力需求和今天的一问一答完全不是一个量级。学生、小企业、独立开发者,都可能用上今天只有大客户才跑得起的AI能力。
Open AI要做全栈AI公司,吃掉整条链
模型自己训,芯片自己设计,推理自己优化,部署自己控制。
Apple和Google都走过这条路。但OpenAI的全栈多了一层:用AI加速AI基础设施建设,再用更好的基础设施跑更强的AI。
这个飞轮一旦转起来,会自己给自己加速。首批GW级数据中心将和微软等合作方从2026年底开始部署。Jalapeño只是第一代,下一代叫什么还不知道——但造它的,大概率不只是人了。
所以,这颗“温和的墨西哥辣椒”,也许就是AI世界开始自造身体的第一口。
-
OpenAI自研芯片来了!每瓦性能超先进水平成本还能节约50%·财联社·(2026/6/25)·检索日期2026/6/25 ↩︎ ↩︎ ↩︎
-
OpenAI发布首款定制AI推理芯片,披露多代计算平台计划·搜狐网·(2026/6/25)·检索日期2026/6/25 ↩︎