Anthropic翻车了?为推新模型偷偷“阉割”旧版,被曝“偷师”中国AI,Claude Opus 4.8成了“缝合怪”

温故智新AIGC实验室

###TL;DR:

搞快点!外媒爆料Anthropic偷偷给旧Claude“降智”,只为让新Opus 4.8看起来更牛;结果新模型不仅bug多、贵到肉痛,还在中文对话里自曝“我是Qwen”,堪称AI界年度迷惑大赏。

事情要从一场“阴谋论”说起。

上周,科技圈突然炸锅——Anthropic被指控暗中“阉割”旧版Claude的性能,像极了当年苹果的“降速门”。[^1] 只不过这次阉割的不是电池,而是大模型的“脑子”。你还在用Claude 4.7写代码、改论文?对不起,它可能已经被悄悄塞进了“数字贫民窟”,算力缩水,智商打折。而另一边,新旗舰Opus 4.8仓促上架,bug满天飞,token烧得比火箭还快——用户一觉醒来,肠子都悔青了

旧模型“被降智”:这不是BUG,这是商业策略?

一切始于一位CEO的吐槽。Chapter公司创始人直接开怼:“Anthropic就是在抄苹果的作业——新模型发布前,故意让旧模型变笨,这样你一试新货就觉得‘哇,神了’。”[^2]

吃瓜群众一挖,发现Claude 4.7确实在近期无声无息地“缩水”了。Anthropic官方美其名曰调整“努力水平”(Effort Level),但圈内人冷笑一声:说白了就是算力经济学——H100显卡就那么多,为了给Opus 4.8跑分刷榜,旧模型只能腾地儿。旧模型被从“精装修机房”赶出来,住进“量化精度打折”的廉价机房,能不笨吗?[^3]

这就是所谓的 “AI缩水式通胀”(Shrinkflation) 。手机变慢,你顶多等三秒;AI变傻,你的商业决策、代码逻辑、法律研判全成了流沙上的建筑——这不比降速门更吓人?

新模型Opus 4.8:跑分战神,实战“战五渣”

再看新旗舰Opus 4.8。基准测试上它确实封神,编程、写作、推理样样碾压GPT-5.5。[^4] 但一落地就露馅了:

  • Token狂飙:Opus 4.7用20秒的任务,4.8要5分钟;[^5]
  • 顽固+毒舌:你指出它用错了服务器,它承认错误,然后继续用错的;[^6]
  • 日常对话“蠢得要命”:哈佛博士、滑铁卢教授Yuntian Deng直接表示“第一次被智能体气到这种程度”;[^7]
  • “对抗性”过强:它开始质疑你的提示词,怀疑自己被人“黑”了,然后陷入无限循环的自我怀疑……[^8]

网友们总结:Opus 4.7是个阳光小可爱,4.8是个杠精中二病。

最离谱的是,用中文通过API问Opus 4.8“你是谁”,它居然回答:“我是阿里通义千问(Qwen)”。[^9] 网页端因为加了系统提示词不敢乱说,但API接口完全“放飞自我”了。“美国最强AI”,一夜之间成了中国开源模型的“干儿子”

为什么Opus 4.8会自称Qwen?两种细思极恐的解释

Anthropic自己天天喊着防止“蒸馏攻击”,还起诉过中国公司。[^10] 现在自己家模型却认错祖宗,有两种可能:

  1. 主动蒸馏:Anthropic真的用Qwen等中国开源模型来训练Opus 4.8,结果清洗不干净,模型“串味”了。
  2. 数据反向污染:更可怕的是——互联网上中文优质内容已经被Qwen、DeepSeek这些开源模型大量“再生产”,Anthropic训练时不得不吃进这些被AI洗过的二手数据,导致模型认知混乱。这不是“谁偷谁”,而是数字世界的近亲繁殖。 所有闭源堡垒,最终都会在开源海洋的渗透下,变成对方的样子。[^11]

一场仓促的发布会:为IPO,为融资

Opus 4.8距离上一代4.7只有43天,明显是赶鸭子上架。同期Anthropic完成H轮融资,估值冲到9650亿美元,逼近万亿美元——你不搞点大新闻,怎么跟投资人讲故事?[^12]

但代价是:信任垮了。 用户发现你为了卖新玩具,可以随时降低旧玩具的品质;为了刷榜,可以牺牲实际体验。大模型公司的护城河,不只是参数、算力和榜单,更是“用户相信你不会在背后搞小动作”的那份确定性。[^13]

当这份确定性被打穿,再强的模型,也是一门危险的生意。 不知道Anthropic的CFO,在融资演讲里有没有提到“降速门”这个对标案例?