吴恩达、Karpathy都投了,微软和SpaceX抢破头:这家公司想给大模型换个“脑子”?

温故智新AIGC实验室

TL;DR:

当所有人都在卷下一个 token 生成速度时,一家叫 Inception 的初创公司,试图把 AI 写字的思路从“一个字一个字地憋”变成“先画个草图再精修”。速度快了10倍,成本低了10倍,但这套“盗梦空间”式的玩法靠谱吗?微软和 SpaceX 为了抢它,差点打起来。

一场“神仙打架”的抢人大战

2026年5月的科技圈,上演了一出堪比《盗梦空间》的戏码:微软和 SpaceX,两个市值万亿的巨头,同时盯上了一家名字就叫 Inception(没错,就是诺兰那部电影)的小公司。1

消息一出,大家的第一反应是:这又是什么天降神兵?

更让人震惊的是,这家公司2024年才成立,种子轮融资才拿了5000万美元,天使投资人名单上却赫然写着吴恩达和 Andrej Karpathy 这两位 AI 界的大神。如今,它的估值预期直接飙到了10亿美元以上——溢价20倍。2

能让微软和马斯克同时下场肉搏,这家公司显然不只是“又一个搞大模型的”那么简单。

三个教授,一个“离经叛道”的想法

Inception 的核心创始人 Stefano Ermon,是斯坦福大学教授,也是目前 AI 画画背后的“神”——扩散模型(Diffusion Model)的共同发明人

你用过的 Midjourney、Stable Diffusion,甚至 Sora,底层都跑着他的技术。3

但 Ermon 在2024年做了一个让全行业都觉得很“离谱”的决定:把扩散模型从图像领域搬到文本生成领域,彻底干掉自回归架构。

等等,自回归又是啥?简单来说,现在所有的大模型(ChatGPT、Claude、Gemini)都是“自回归”的。它们生成文字就像一个人写文章,只能一个字一个字地往后憋,绝不可能跳着写

这种模式很可靠,但有个结构性天花板:速度被串行锁死了。你再怎么换芯片、优化软件,也改变不了“一个字写完了才能写下一个”的物理定律。

而 Inception 的方案是:先画一个“草稿”(从噪声中生成),然后通过神经网络反复精修,多个 token 并行输出。3

这就像你写文章不再是逐字敲键盘,而是脑子浮现出一个粗糙的段落,然后一次性在屏幕上修改出最终版。快了不是一点半点。

快10倍,便宜10倍,但质量呢?

2026年2月,Inception 推出了第二代模型 Mercury 2。

根据第三方测试,Mercury 2 的输出吞吐量大约是每秒 1000 个 token。作为对比,Claude 4.5 Haiku 是每秒 89 个 token,GPT-5 Mini 是每秒 71 个 token。3

快了将近10到14倍。

在质量上,Mercury 2 在 AIME 2025 数学测试中得了 91.1 分,GPQA 科学推理测试得了 73.6 分——和 Claude 4.5 Haiku、GPT-5.2 Mini 在同一个竞争区间。

Ermon 也挺坦诚:Mercury 2 对标的是“小快灵”的模型,不是那种全能旗舰。在复杂推理任务上,扩散模型的质量大约是自回归模型的 85%-95%。3

但你品,你细品:

  • 实时语音交互场景里,你是想要一个0.1秒就回你话但偶尔有点“憨”的 AI,还是等 1 秒才回你但逻辑完美的 AI?
  • 代码自动补全里,你是想要一个瞬间给出建议的 AI,还是等你敲完一行才跳出来的 AI?
  • Agent 持续调用里,你是想要一个飞快跑完流程的 AI,还是卡在半路等你指令的 AI?

对于大量对延迟敏感的场景,扩散模型的 10 倍速度优势,足以让 10% 的质量差距变得可以接受。

更关键的是,扩散模型还自带几个“外挂”:

  • 输出可控性更强:天然遵循指定的 JSON 格式,企业级应用狂喜。
  • 天然支持多模态:用一套框架处理语言、图像、音频,不用再拼接不同架构。
  • 内置纠错能力:在精炼过程中可以反复修正,理论上能减少“幻觉”。

当然,也有研究者泼冷水:扩散模型的 Scaling Law(规模法则)还没验证,到底能不能像自回归模型那样“参数越多、数据越多、效果越好”,没人知道。2

但反过来说,正是这种不确定性,才让它有可能成为下一个范式。

微软和 SpaceX 的“后 OpenAI 时代”军备竞赛

这波收购大战,表面上是抢公司,实际上是 AI 行业的“势力洗牌”。

2026年4月,微软和 OpenAI 官宣了关系的大调整。4 微软对 OpenAI 技术的独家使用权被取消,OpenAI 可以拥抱亚马逊等竞争对手。这段曾经被称为“科技界最佳 Bromance”的关系,本质上变成了“开放式婚姻”。

微软在 OpenAI 身上砸了超过 130 亿美元,现在 OpenAI 不再是它的独家武器,微软当然要加速摆脱依赖,寻找下一个“盟友”。

于是,他们先看上了代码生成公司 Cursor,但因为自己已经有 GitHub Copilot,怕反垄断审查过不了,忍痛放弃。而 SpaceX 随后立刻和 Cursor 签了 600 亿美元的收购期权协议。1

微软放弃 Cursor 后,转头就盯上了 Inception。结果 SpaceX 也像闻到血腥味的鲨鱼,紧随而来。

这里不得不提一下马斯克的战略布局:今年2月,SpaceX 收购了马斯克的 xAI,合并后估值 1.25 万亿美元。然后又启动 Terafab 半导体工厂项目,计划自研芯片。现在又追 Inception……1

马斯克显然在用一个平台级的思路,系统性地构建从芯片到模型到应用的完整 AI 技术栈。

而 Inception 的团队,恰好证明了扩散式 LLM 不只是个研究突破,而是一个“企业今天就能部署”的可落地技术。3

在 AI 的世界里,真正稀缺的从来不是资本,而是敢走不同路线的人。

当微软和 OpenAI 的“婚姻”走向开放式关系,当 SpaceX 从火箭公司变成 AI 收购机器,这场“后 OpenAI 时代”的军备竞赛,才刚刚开始。

不管 Inception 最后花落谁家,它都已经证明了一件事:如果你想颠覆一个行业,最好的方式不是做得比别人好 10%,而是从根本上换个玩法。


引用


  1. 微软被曝考虑收购大模型创企,SpaceX也看上了同一家·新浪财经(2026/5/14)·检索日期2026/5/18 ↩︎ ↩︎ ↩︎

  2. 消息称微软筹备收购 AI 初创企业,降低对 OpenAI 依赖·17173游戏网(2026/5/14)·检索日期2026/5/18 ↩︎ ↩︎

  3. 微软被曝考虑收购大模型创企,SpaceX也看上了同一家·搜狐网(2026/5/14)·检索日期2026/5/18 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  4. 微软被曝考虑收购大模型创企,SpaceX也看上了同一家·雪球(2026/5/14)·检索日期2026/5/18 ↩︎