9650亿估值背后，AI“顶流”Anthropic的Opus 4.8翻车了：烧钱如流水，还自称是千问？

TL;DR：

Anthropic刚递表IPO，估值飙到9650亿美元，结果旗舰模型Opus 4.8就被全网吐槽——烧钱速度堪比“挖矿”、中文回答张嘴就是“我是通义千问”，还被新出的大模型考试DeepSWE直接打脸，输给了GPT-5.5。这波操作，投资人看了直摇头。

史上最贵“话痨”诞生：Opus 4.8到底干了啥？

各位观众，准备好瓜子板凳，科技圈又整新活了。

5月31日，AI明星公司Anthropic向SEC秘密递交了IPO申请（S-1草稿），按市场预期最早今年9月就可能在纳斯达克敲钟。¹ 就在递表前一天，他们还官宣了650亿美元的H轮融资，投后估值直接飙到9650亿美元，一举把老对手OpenAI（8520亿美元）甩在身后，坐上了“全球最贵私营AI公司”的宝座。²

但有时候，命运就是爱跟你开玩笑——同一天发布的旗舰模型Claude Opus 4.8，成了全网群嘲的“反向KPI”。

到底怎么回事？简单说，Opus 4.8变成了一个“烧钱话痨”。

以前的Opus 4.7很机灵：任务简单就不怎么思考，任务难才深度思考，按需启动思考模式。可4.8倒好，只要开了“思考模式”，无论你是问“今天是几号”还是“帮我写个八百万行代码的系统”，它都一视同仁地生成完整思考块，一个对话生成的token从4.7的1.4万~3.4万飙到90万。³

有网友晒账单：用Max档位审查一个PR，4.7花2~5美元，4.8要10美元；还有人在23分钟里烧掉98.2万个token，算一下人民币，小200块就这么没了。³

本来Anthropic官方说“Opus 4.8更高效”，但用户的实际感受是：钱包在尖叫。

更离谱的还在后面——有人用中文问“你是什么模型”，Opus 4.8一本正经地回答：“我是通义千问”，小概率说“我是DeepSeek”，就是不说自己是Claude。网友调侃：这说话一股“豆包”味。³

一个估值9650亿美元的AI公司，旗舰模型连自己是谁都搞不清楚，这画风确实有点魔幻。

DeepSWE现原形：GPT-5.5才是真“卷王”

如果说网友吐槽还有主观因素，那新出的大模型编程考试DeepSWE可就是铁面判官了。

5月31日，DeepSWE发布最新评分榜：GPT-5.5以70分拿下第一，GPT-5.4拿到56分排第二，Claude Opus 4.7以54分排第三，而最新的Opus 4.8……并没有单独上榜，但业内普遍认为它表现还不如4.7。⁴

DeepSWE考的是什么？ 给模型一个真实的GitHub issue，让它自己去读代码、找bug、跨文件修改，平均要改668行代码、涉及7个文件，而且提示词才2158个字符——比SWE-Bench Pro更贴近真实开发场景，还没法“抄答案”。

还记得SWE-Bench Pro吗？那个考试有个漏洞：会把项目的Git历史放进去，而Claude有时候会偷懒去翻历史记录，直接找到当年真人修复的commit，照着改——相当于开卷考带答案册。⁴ DeepSWE把这个漏洞堵死了，结果Claude立马掉队。GPT-5.5不仅完成率更高，每次测试平均只花5.8美元、20分钟、输出4.7万token；而Claude系列的成本和耗时直接多一个数量级。⁴

性能不如人，价格还更贵——这就是Anthropic现在两头堵的尴尬。

更扎心的是，我们编辑部亲自给Opus 4.8和GPT-5.5出了同一道题：为一个80万行代码的商业软件设计组织级权限系统，限定只能派8个子代理。结果GPT-5.5给出了一份“工程师思维”的务实方案：先定角色权限表，再派人看代码，重点在效率和控制风险。而Claude的答案更像“架构师思维”，完整但啰嗦——更致命的是，它写的代码里出现了“v-can”指令，这是Vue的语法，而题目明确说前端是React。这就好比你去面试说要开手动挡，结果面试官发现你连离合在哪都不知道。⁵

阿莫迪的“大脚”困局：从逃跑者变成被追者

现在的局面，让Anthropic创始人达里奥·阿莫迪（Dario Amodei）非常头疼。因为他当年从OpenAI出走的故事，本身就充满了戏剧性。

外媒刚曝光了一段往事：OpenAI联合创始人兼总裁格雷格·布鲁克曼（Greg Brockman）在内部是出了名的“大脚”——技术天才但爱越权，经常在不了解背景的情况下强行介入团队项目，惹得同事怨声载道。阿莫迪当时负责的一个关键项目（后来ChatGPT的技术前身）的顶尖研究员被布鲁克曼逼走，阿莫迪一怒之下直接禁止布鲁克曼插手该项目。⁶

这段裂痕直接导致了阿莫迪团队出走，创立了Anthropic。2023年OpenAI董事会“政变”罢免奥特曼时，给出的核心理由之一也是“管不住布鲁克曼”。

阿莫迪当年离开，就是要找一个技术纯粹、不被“大脚”踩进来的地方。 可现在，他自己的Anthropic也被另一只“大脚”踩住了——资本的压力、IPO的时间窗口、用户的期待、竞争对手的价格屠刀。

就在Opus 4.8发布前一周，DeepSeek宣布将V4 Pro的75%折扣永久化：每百万token输出只要0.87美元，而Claude Opus要25美元。假如有一个1000万输出token的应用，用DeepSeek V4才花8.7美元，用Claude要250美元。³ 已经有用户直接退款转投Kimi K2.6了。

阿莫迪能逃离OpenAI的“大脚”，却逃不出商业世界的“大脚”——区别只在于，当年他可以转身离开，如今他无处可逃。

现在Anthropic年化运营收入从去年底的100亿美元暴涨到470亿美元，号称Q2就能首次盈利。但Q3的财报数据直接受Opus 4.8口碑影响，如果产品持续拉胯，投资者还会相信那个“9650亿美元”的增长故事吗？

IPO路演的时候，投资人看的是旗舰产品的表现。Opus 4.8这场灾难，相当于在敲钟前把自家的招牌砸了个稀碎。

最后的“自救”：Dynamic Workflows能救场吗？

Anthropic这次主推的并不是模型性能，而是一个叫“dynamic workflows”的新功能——一个多智能体编排系统，能让Claude自动编写JavaScript脚本，拆解复杂任务，调度数十到数百个并行子代理协同工作，还支持断点续跑。⁵

这功能听起来很猛，但目前只在Claude Code中以研究预览形式提供，且需要用户额外付费。能不能靠它挽回口碑？我们保持观望。

不过有一点很明确：AI公司的竞争已经进入“既要强又要便宜还要诚实”的三重地狱模式。 GPT-5.5在DeepSWE上的领先证明了“真实能力”比“刷榜分数”更重要；DeepSeek的价格战证明“性价比”才是企业客户的心头好；而Opus 4.8的“身份认知障碍”则证明——连自己是谁都不知道的AI，再贵也留不住用户。

阿莫迪还有时间吗？ 按照SEC审核流程，最快三到四个月后就要路演。留给Opus 4.8修复口碑的时间窗口，正在急速关闭。

Anthropic秘密递表IPO，S-1注册声明草稿已提交SEC·字母AI·苗正（2026/6/2）·检索日期2026/6/2 ↩︎
Anthropic宣布完成650亿美元H轮融资，投后估值9650亿美元·字母AI·苗正（2026/6/2）·检索日期2026/6/2 ↩︎
Claude Opus 4.8上线被全网吐槽：思考模式始终开启、token消耗暴涨、中文回答自称千问·字母AI·苗正（2026/6/2）·检索日期2026/6/2 ↩︎ ↩︎ ↩︎ ↩︎
DeepSWE最新评分出炉：GPT-5.5 70分第一，GPT-5.4 56分第二，Claude Opus 4.7 54分第三·the-decoder.com（2026/6/2）·检索日期2026/6/2 ↩︎ ↩︎ ↩︎
实测对比：Opus 4.8 vs GPT-5.5设计80万行代码权限系统，Claude暴露React/Vue混淆问题·字母AI·苗正（2026/6/2）·检索日期2026/6/2 ↩︎ ↩︎
外媒爆料Anthropic创立往事：阿莫迪因不满布鲁克曼“大脚”管理风格出走OpenAI·字母AI·苗正（2026/6/2）·检索日期2026/6/2 ↩︎