TL;DR:
OpenAI 九个月搓出首颗自研推理芯片“Jalapeño”,博通亲手交货给奥特曼。更骚的是:自家 AI 模型帮自己设计了芯片——套娃玩到新高度。每瓦性能号称“大幅优于”业界,目标把推理成本砍半,让更多普通人用上便宜的智能。
这速度,隔壁英伟达看了都得揉眼睛
就在刚刚,OpenAI 史上首颗芯片诞生了。名字相当火辣,叫 Jalapeño,墨西哥辣椒(doge)1。从一张白纸到流片,整个过程只花了九个月。OpenAI 管这叫“史上最快的高性能先进半导体 ASIC 开发周期”。啧啧,要知道,造芯片这种活儿,通常一搞就是好几年。更有趣的是,帮他们加速设计的,正是 OpenAI 自己家的模型。自己造的 AI,造出了自己要跑的芯片1。
这颗芯片不是拿以前的 AI 芯片改改凑出来的,而是为现代大模型推理从零设计。它参考的,就是 OpenAI 每天在 ChatGPT、Codex、API 以及未来 Agent 产品上跑的那些真实系统。目标也很明确:既要有顶级 AI 加速器的算力和吞吐,又要把延迟压到接近最快的专用推理系统那种水平。
一颗“辣椒”,亲手交到奥特曼手上
颇有画面感的一幕是,这颗 Jalapeño 芯片,正是博通的总裁兼 CEO Hock Tan 和半导体事业部总裁 Charlie Kawwas,亲手交给 OpenAI 的 CEO Sam Altman 和总裁 Greg Brockman 的1。OpenAI 在官宣博客中表示,这标志着 OpenAI“为自家模型和产品构建全栈”战略的重要一步。
而且合作不止博通一家:
- OpenAI 出脑子:从零开始设计芯片架构,靠的是它对大模型底层逻辑的深度理解,再结合自己的模型路线图、kernel、服务系统和产品需求;
- 博通出手艺:负责芯片实现、网络,还有把东西做成大规模量产;
- Celestica 管杂活:板卡、机架、系统组装这些事。
博通还明确提到它的 Tomahawk 网络芯片,被用来帮平台走向大规模量产。整体来看,未雨绸缪的 OpenAI 这次是真的打算把整条产业链都捏在自己手里了。
以前它只干两件事:训练出最强的模型,再拿模型做产品(ChatGPT、Codex、API 那一套)。现在它往基础设施底部又挖了一层——芯片架构、kernel、内存系统、网络、调度、部署系统,全自己来。用 OpenAI 自己的话讲,这叫“全栈”。
而更好的基础设施→更高的算力效率→更好的训练和服务→更强的模型→更好的产品→更多用户和收入→再回头投下一代基础设施。转着转着,智能就越来越强、越来越稳、越来越便宜。
九个月,模型帮自己造芯片——真·套娃
那凭什么只花了这么短的时间?究其原因,一方面是靠软硬件一起开发,比如 OpenAI 的工程师和博通的造芯团队贴在一起干;另一方面则是 OpenAI 直接用自家的模型,去加速芯片设计和优化的部分环节。也就是说,给用户用的那些模型,反过来在帮 OpenAI 造下一代模型要跑的硬件。这波啊,这波叫“AI 设计芯片 → 芯片跑 AI → AI 再设计下一代芯片”——飞轮一旦转起来,就有点停不下来的意思了。
负责 OpenAI 硬件项目的 Richard Ho 说,他们是围着那些“最要紧的东西”来优化架构的——kernel、内存搬运、网络、服务模式。根据早期测试,Jalapeño 能把 OpenAI 最重要的活儿,跑到接近硬件理论极限。
简单理解就是,芯片的纸面性能是 100 分,一般芯片实际只能发挥个六七十分,剩下的都在数据搬来搬去的路上耗掉了。Jalapeño 的架构就是要减少数据搬运,把算力、内存、网络几样资源配平,让实际发挥无限逼近那 100 分。
不过,性能到底多强,OpenAI 还没给最终数字,说详细技术报告过几个月再发。但早期测试透了个底:每瓦性能会“大幅优于”目前业界最强水平1。(至于是否在画饼,日后便见分晓了。)实验室里,工程样片已经在跑真实的机器学习任务了,频率和功耗都按量产目标来,其中就包括 GPT‑5.3‑Codex‑Spark 这种模型。
推理芯片为啥这么香?成本砍半是真的吗?
你可能会问:为什么 OpenAI 死磕推理芯片,不去整训练芯片?逻辑其实不难理解:推理,就是 AI 触达用户的最后一环。 成本降一点、速度快一点、稳定多一点,落到用户那头,就是 ChatGPT 答得更快、Codex 能多干几步少等会儿、API 更便宜好搭、高峰期更不容易崩。
根据路透社等媒体的报道,OpenAI 与博通合作开发的这款定制 AI 推理芯片,目标是把推理成本比现有方案降低 50%23。博通 CEO Hock Tan 在接受采访时表示,到目前为止,相较一般 AI 绘图处理器(GPU),这款芯片能省下约 50% 的成本3。这可不是小数目——要知道 OpenAI 去年烧钱超 340 亿美元,光芯片采购和基础设施租赁就占了大头。自己造芯,不是为了取代英伟达,而是为了把那 31% 的微软基础设施租赁费和 22% 的英伟达 IP 授权溢价,变成自己的毛利。
无法停止的飞轮:吉瓦级数据中心已在路上
Jalapeño 不是一锤子买卖。它是一个“多代计算平台”的第一步。计划 2026 年底先部署起来,之后几年接着扩。整个平台是 OpenAI 设计的加速器,加上博通的芯片实现、网络和连接技术,再加 Celestica 的板卡、机架、系统能力,三家拼起来的。
Hock Tan 表示,这只是个开头,后面是一张跨好几代的路线图。他还顺嘴提了一句——靠着跟 OpenAI 直接共同开发的芯片,他们要在 2026 年开始,跟微软等伙伴一起,铺起吉瓦级(gigawatt)的数据中心1。吉瓦是什么概念?一座大型核电站的发电量级别。OpenAI 是真打算用电厂的规模来堆算力。Greg Brockman 甚至还给这次合作上了个价值——“世界正在转向一个由算力驱动的经济”1。
在他的逻辑里,Jalapeño 是 OpenAI 长期全栈基础设施战略的一环:自己设计的栈越多,就能用更高的效率“卖”出更多的智能,把先进 AI 推向更广的人群。
所以这颗辣椒最后想干的事,说穿了不复杂:把更多算力变成普通人能天天用得起的智能。 学生、开发者、小老板、研究员、企业,谁想学东西、想创作、想解决难题,都能用上。
当然,最妙的还是技术的反复套娃:AI 设计芯片,芯片跑 AI,AI 再去设计下一代芯片。而这个圈一旦转起来,就有点停不下来的意思了。