OpenAI 造芯只花九个月，这颗“辣椒”辣不辣？

TL;DR：

OpenAI 九个月搓出首颗自研推理芯片“Jalapeño”，博通亲手交货给奥特曼。更骚的是：自家 AI 模型帮自己设计了芯片——套娃玩到新高度。每瓦性能号称“大幅优于”业界，目标把推理成本砍半，让更多普通人用上便宜的智能。

这速度，隔壁英伟达看了都得揉眼睛

就在刚刚，OpenAI 史上首颗芯片诞生了。名字相当火辣，叫 Jalapeño，墨西哥辣椒（doge）¹。从一张白纸到流片，整个过程只花了九个月。OpenAI 管这叫“史上最快的高性能先进半导体 ASIC 开发周期”。啧啧，要知道，造芯片这种活儿，通常一搞就是好几年。更有趣的是，帮他们加速设计的，正是 OpenAI 自己家的模型。自己造的 AI，造出了自己要跑的芯片¹。

这颗芯片不是拿以前的 AI 芯片改改凑出来的，而是为现代大模型推理从零设计。它参考的，就是 OpenAI 每天在 ChatGPT、Codex、API 以及未来 Agent 产品上跑的那些真实系统。目标也很明确：既要有顶级 AI 加速器的算力和吞吐，又要把延迟压到接近最快的专用推理系统那种水平。

一颗“辣椒”，亲手交到奥特曼手上

颇有画面感的一幕是，这颗 Jalapeño 芯片，正是博通的总裁兼 CEO Hock Tan 和半导体事业部总裁 Charlie Kawwas，亲手交给 OpenAI 的 CEO Sam Altman 和总裁 Greg Brockman 的¹。OpenAI 在官宣博客中表示，这标志着 OpenAI“为自家模型和产品构建全栈”战略的重要一步。

而且合作不止博通一家：

OpenAI 出脑子：从零开始设计芯片架构，靠的是它对大模型底层逻辑的深度理解，再结合自己的模型路线图、kernel、服务系统和产品需求；
博通出手艺：负责芯片实现、网络，还有把东西做成大规模量产；
Celestica 管杂活：板卡、机架、系统组装这些事。

博通还明确提到它的 Tomahawk 网络芯片，被用来帮平台走向大规模量产。整体来看，未雨绸缪的 OpenAI 这次是真的打算把整条产业链都捏在自己手里了。

以前它只干两件事：训练出最强的模型，再拿模型做产品（ChatGPT、Codex、API 那一套）。现在它往基础设施底部又挖了一层——芯片架构、kernel、内存系统、网络、调度、部署系统，全自己来。用 OpenAI 自己的话讲，这叫“全栈”。

而更好的基础设施→更高的算力效率→更好的训练和服务→更强的模型→更好的产品→更多用户和收入→再回头投下一代基础设施。转着转着，智能就越来越强、越来越稳、越来越便宜。

九个月，模型帮自己造芯片——真·套娃

那凭什么只花了这么短的时间？究其原因，一方面是靠软硬件一起开发，比如 OpenAI 的工程师和博通的造芯团队贴在一起干；另一方面则是 OpenAI 直接用自家的模型，去加速芯片设计和优化的部分环节。也就是说，给用户用的那些模型，反过来在帮 OpenAI 造下一代模型要跑的硬件。这波啊，这波叫“AI 设计芯片 → 芯片跑 AI → AI 再设计下一代芯片”——飞轮一旦转起来，就有点停不下来的意思了。

负责 OpenAI 硬件项目的 Richard Ho 说，他们是围着那些“最要紧的东西”来优化架构的——kernel、内存搬运、网络、服务模式。根据早期测试，Jalapeño 能把 OpenAI 最重要的活儿，跑到接近硬件理论极限。

简单理解就是，芯片的纸面性能是 100 分，一般芯片实际只能发挥个六七十分，剩下的都在数据搬来搬去的路上耗掉了。Jalapeño 的架构就是要减少数据搬运，把算力、内存、网络几样资源配平，让实际发挥无限逼近那 100 分。

不过，性能到底多强，OpenAI 还没给最终数字，说详细技术报告过几个月再发。但早期测试透了个底：每瓦性能会“大幅优于”目前业界最强水平¹。（至于是否在画饼，日后便见分晓了。）实验室里，工程样片已经在跑真实的机器学习任务了，频率和功耗都按量产目标来，其中就包括 GPT‑5.3‑Codex‑Spark 这种模型。

推理芯片为啥这么香？成本砍半是真的吗？

你可能会问：为什么 OpenAI 死磕推理芯片，不去整训练芯片？逻辑其实不难理解：推理，就是 AI 触达用户的最后一环。 成本降一点、速度快一点、稳定多一点，落到用户那头，就是 ChatGPT 答得更快、Codex 能多干几步少等会儿、API 更便宜好搭、高峰期更不容易崩。

根据路透社等媒体的报道，OpenAI 与博通合作开发的这款定制 AI 推理芯片，目标是把推理成本比现有方案降低 50%²³。博通 CEO Hock Tan 在接受采访时表示，到目前为止，相较一般 AI 绘图处理器（GPU），这款芯片能省下约 50% 的成本³。这可不是小数目——要知道 OpenAI 去年烧钱超 340 亿美元，光芯片采购和基础设施租赁就占了大头。自己造芯，不是为了取代英伟达，而是为了把那 31% 的微软基础设施租赁费和 22% 的英伟达 IP 授权溢价，变成自己的毛利。

无法停止的飞轮：吉瓦级数据中心已在路上

Jalapeño 不是一锤子买卖。它是一个“多代计算平台”的第一步。计划 2026 年底先部署起来，之后几年接着扩。整个平台是 OpenAI 设计的加速器，加上博通的芯片实现、网络和连接技术，再加 Celestica 的板卡、机架、系统能力，三家拼起来的。

Hock Tan 表示，这只是个开头，后面是一张跨好几代的路线图。他还顺嘴提了一句——靠着跟 OpenAI 直接共同开发的芯片，他们要在 2026 年开始，跟微软等伙伴一起，铺起吉瓦级（gigawatt）的数据中心¹。吉瓦是什么概念？一座大型核电站的发电量级别。OpenAI 是真打算用电厂的规模来堆算力。Greg Brockman 甚至还给这次合作上了个价值——“世界正在转向一个由算力驱动的经济”¹。

在他的逻辑里，Jalapeño 是 OpenAI 长期全栈基础设施战略的一环：自己设计的栈越多，就能用更高的效率“卖”出更多的智能，把先进 AI 推向更广的人群。

所以这颗辣椒最后想干的事，说穿了不复杂：把更多算力变成普通人能天天用得起的智能。 学生、开发者、小老板、研究员、企业，谁想学东西、想创作、想解决难题，都能用上。

当然，最妙的还是技术的反复套娃：AI 设计芯片，芯片跑 AI，AI 再去设计下一代芯片。而这个圈一旦转起来，就有点停不下来的意思了。

引用

APPSO《OpenAI 发布首款芯片，只花了九个月》·微信公众号·2026/6/25·检索日期 2026/6/25 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
爱范儿《OpenAI 计划自研AI 芯片，以减少对英伟达的依赖》·2024/10/31·检索日期 2026/6/25 ↩︎
世界新闻网《OpenAI携手博通推首款AI芯片号称可省50%成本》·2026/6/24·检索日期 2026/6/25 ↩︎ ↩︎