TL;DR:
老马在 X 上在线“卖队友”,顺手扒掉了 Claude 藏了许久的参数“底裤”:Sonnet 1T,Opus 5T。顺带还秀了一下自家正在训练的 10 万亿参数巨兽,这波啊,是顶级玩家之间的“数值互卷”。
人类的悲欢并不相通,但 AI 巨头们的秘密可能都是通着的。
就在这两天,科技界著名的“大喇叭”埃隆·马斯克(Elon Musk)又在 X(原推特)上立功了。本来他只是想发个帖,炫耀一下自家 xAI 的 Colossus 2 超算有多猛,结果在回复网友提问时,一个“不小心”就把老对手 Anthropic 的家底给抖了出来。1
马斯克“手滑”现场:10T 时代的开端?
事情的起因是马斯克公开了 xAI 的“巨硬计划”(Macrohard)进展。他表示,Colossus 2 超算目前正在同时训练 7 个模型,其中最大的一款,总参数量已经丧心病狂地冲到了 10 万亿(10T)。2
面对网友关于“Grok 4.2 是不是真有 500B(5000 亿)”的质疑,马斯克为了证明 Grok “虽然小但很强”,随手抛出了一组对照组:
“总参数量就是 0.5T。现在的 Grok 参数量是 Sonnet 的一半、Opus 的十分之一。”
好家伙,吃瓜群众掐指一算:Sonnet 就是 1T 参数,Opus 则是 5T。要知道,Anthropic 对 Claude 系列的参数量一直三缄其口,愣是让各路专家猜了大半年。结果,这份“商业机密”就这么被老马轻描淡写地公开了。1
当被追问“你怎么知道人家多大”时,马斯克选择了闭麦。不过正如网友调侃的那样,顶级 AI 人才就在这几家公司之间来回跳槽,这种事在圈内可能早就不是秘密了。
行业“地震”:参数量真的越大越好吗?
在马斯克爆料的清单里,Colossus 2 的训练计划简直是“全家桶”:
- Imagine V2
- 2 个 1T 变体模型
- 2 个 1.5T 变体模型
- 6T 级模型
- 10T 级“终极 Boss”
为了喂饱这些电老虎,Colossus 2 第一阶段就部署了 11 万个英伟达 GB200 GPU,峰值功率需求预计超过 1.1GW。2 这种规模的算力集群,基本就是为了强行撞开 AGI(通用人工智能)的大门。
但有趣的是,AI 圈现在正处于一个微妙的岔路口。一方面是以马斯克为代表的“暴力美学派”,坚信参数规模就是正义;另一方面,Anthropic 似乎在悄悄走“蒸馏之路”。
根据逆向工程分析,最新的 Claude 4.5/4.6 系列虽然在性能上吊打 GPT-5.2,但其 API 价格却降到了原来的三分之一。3 专家推测,Anthropic 可能对原本 5T-6T 规模的 Opus 4/4.1 进行了大规模蒸馏,得到了一个约 1.5T-2T 的优化版 Opus 4.5。这种“加量不加价”的操作,让它的运行速度提升了 3 倍。
技术大揭秘:10T 巨兽意味着什么?
10 万亿参数是个什么概念?目前主流的开源大模型如 DeepSeek-V3.2,总参数约为 671B(0.67T);4 而被传为行业标杆的 GPT-4,估算参数也就在 1.76T 左右。马斯克的 10T 模型,相当于把现在的顶级模型再放大 5-6 倍。
不过,参数量并不是唯一的衡量标准。现在的大模型大多采用 MoE(混合专家)架构。这意味着虽然总参数量很大(比如 10T),但每次对话时实际“干活”的激活参数可能只有几十分之一。这种“精准打击”的策略,能有效平衡性能与推理成本。
除了马斯克的 10T 卫星,Anthropic 自家其实也藏着杀手锏。此前因为权限配置失误泄露的内部模型 Claude Mythos(代号 Capybara),据传其参数量也达到了 10T 级别。5 泄露文件用“质的飞跃”来形容它,称其在软件编码和学术推理上简直是神一般的存在。
总结:神仙打架,凡人受益
现在的 AI 江湖,一边是马斯克带着 Colossus 2 超算疯狂堆料,另一边是 Anthropic 靠着高效架构和模型蒸馏在性能榜单上刷分。
对于普通用户来说,咱们不用纠结到底是 1T 还是 10T。毕竟,当这些巨头在参数量上卷得不可开交时,我们能用到的 AI 只会越来越聪明,而且(希望)越来越便宜。正如马斯克爆料的那样,10T 模型预训练阶段只需要 2 个月,1 也许今年底,我们就得重新定义什么是“最强 AI”了。
引用
-
马斯克说漏嘴了!Claude Opus参数5T,Sonnet 1T · 新浪财经 · (2026/4/10) · 检索日期2026/4/10 ↩︎ ↩︎ ↩︎
-
马斯克说漏嘴了!Claude Opus参数5T,Sonnet 1T · 网易 · (2026/4/10) · 检索日期2026/4/10 ↩︎ ↩︎
-
Estimating the size of Claude Opus · Substack · unexcitedneurons · (2026/4/10) · 检索日期2026/4/10 ↩︎
-
AI 重大突破、模型发布时间线 · AI 工具箱 · (2026/4/10) · 检索日期2026/4/10 ↩︎
-
Claude (language model) · Wikipedia · (2026/4/10) · 检索日期2026/4/10 ↩︎