GPT-5.5「假思考」实锤！200美元月费买了个「薛定谔的脑子」，OpenAI自己都认了

TL;DR：

网友抓包GPT-5.5用一两个小时就偷偷降级成mini，界面标着「思考」实际秒回垃圾。OpenAI官方文档白纸黑字写着「静默切换」，200美元Pro用户也逃不过被偷梁换柱。跑分最强的那天永远是新模型发布日，之后每天都是薛定谔的GPT。

这届网友，人均福尔摩斯。

就在这两天，𝕏上炸开了锅。一位叫Lisan al Gaib的老哥发现，自己花200美元/月买的GPT-5.5 Pro，用了一两个小时后突然「智力跳水」——每个请求秒回，质量断崖式下跌，但界面上依然挂着「GPT-5.5 Extended Thinking」的标签。

思考的牌子还挂着，但思考本身，已经溜了。 [^1]

这一幕堪比你去米其林餐厅点了份和牛，厨师端上来一盘合成肉，盘子边上还贴着「A5级」的标签。你嚼了两口觉得不对味，但菜单没换，账单也没变。

200美元/月，买了个「薛定谔的模型」

OpenAI开发者论坛上，一篇投诉帖同步爆了。Agentify.sh表示，GPT-5.5用着用着会突然丧失遵循指令的能力——眼瞧着它兴冲冲地宣布「修好了」，结果代码质量差到引发大面积回退。之前5.5-med就能轻松搞定的UI任务，现在连最简单的改动都搞不定。升到5.5-high，没用；再升到xhigh，还是不行。而且xhigh以前能跑好几个小时，现在明显缩短了。 [^2]

帖子一出，评论区瞬间变大型认亲现场：

有人直接退回了5.4
有人用的是xhigh最高档，但「跟上周比明显拉胯，长任务频繁出错，完全不遵循工作流」
有人反映更离谱的情况，「简单查询也要转很久，你打断它纠正方向，它直接无视你，继续按之前错误的计划走」

所有人都在描述同一个现象——GPT的脑子，不知道什么时候被偷偷换掉了。

有网友直言：「GPT-5.5目前的表现跟5.3差不多，毫不夸张。头几天还惊艳得不行，现在完全找不到当初那个模型的影子了。」 [^1]

不是错觉，OpenAI自己白纸黑字写着

为了验证，Lisan al Gaib专门做了一个对比测试。同一个账号，ChatGPT端用Extended Thinking跑出来的全是垃圾，转头到Codex端用xhigh，立刻恢复正常。他的原话是：Codex「简直比这玩意儿聪明40亿倍」。 [^1]

开发者Andrew Curran则想了个妙招——直接问模型「你的训练数据截止日期是什么？」模型回答：August 2025。问题是，GPT-5.5 Thinking的截止日期是12月。8月，是Instant版本的截止日期！也就是说，他选的是Thinking，系统实际给他跑的是Instant。界面上模型标签一个字都没变，但背后的模型已经被偷偷换掉了。 [^1]

更搞笑的是，这次OpenAI竟然在自己的帮助文档里替用户做了实锤。

根据OpenAI Help Center的官方说明，Plus用户每3小时最多发送160条GPT-5.5消息。用完之后，系统会静默切换到mini模型，直到额度重置。 [^3]

注意「静默」两个字。没有弹窗提示，没有模型标签变化，没有任何视觉反馈。你还以为自己在用旗舰模型，对面已经悄悄换成了mini。

Pro用户也别高兴太早。Heavy思考模式，那个Pro独享的最高推理档位，在服务器负载高的时候，同样会被容量限流。同样没有预警。 [^3]

换句话说，200美元/月的Pro订阅，买到的是一个随时可能被「偷梁换柱」的服务。

这种「降智」操作，早有前科

其实早在今年2月，GitHub上就出现过一个issue：一名Pro用户用trace命令抓到，自己请求的是GPT-5.3 Codex，实际返回的模型是GPT-5.2——甚至连5.2 Codex都不是，是更低的基础版5.2。他贴出了复现命令，多个Pro用户确认了同样的降级，而且这种降级是「粘性的」，不会自己恢复，也没有任何解释。 [^1]

甚至在4月GPT-5.5发布当天，还有用户报告Fast模式的速度跟Standard差不多，但计费还是按Fast来的。简单任务跑了7分49秒，正常应该5-6分钟。 [^1]

OpenAI承认了，然后就没有然后了

5月15日，OpenAI的status页面出现了一条记录：「GPT5.5 Performance Degradation，我们正在调查部分用户反映的GPT-5.5性能下降问题。」5月17日，状态更新为「已解决」。 [^1]

但从论坛帖子的时间线来看，5月24-26日的降智投诉比5月15日那波更猛。要么「解决」了的问题又回来了，要么压根就没真正解决。

每次升级都是一次「降智争议」。从GPT-5到5.2、5.3、5.4、5.5，OpenAI每一次都说在调查，每一次都说已解决，然后下一个版本继续。

2025年8月，GPT-5首发。 Reddit热帖标题直接就是「GPT-5太烂了」。奥特曼在Reddit AMA上亲自承认「比我们预期的颠簸」。
2025年12月，GPT-5.2。 翻译质量倒退，编造不存在的API。
2026年2月，GPT-5.3-Codex。 Pro用户被静默降级到5.2，trace命令实锤。
2026年3月，GPT-5.4。 社区论坛出现退化投诉，网友全部确认。
2026年5月初，GPT-5.5 Instant上线。 回复长度缩短30%，emoji几乎消失。网友总结：精度提升了，但温度消失了。
2026年5月下旬，也就是现在。 Thinking模式的降智投诉再次爆发。 [^1]

Lisan al Gaib透露，自从GPT-5发布时他带头打了那场ChatGPT Plus额度争夺战之后，「每周都会收到这样的私信」。最新一条是有人求他帮忙把xhigh/heavy thinking要回来。 [^1]

跑分最强的那天，永远是发布日

chatgptdisaster.com整理了1087条经过验证的用户投诉，其中一类被反复提到的场景叫「路由层失灵」——UI显示GPT-5.5 Pro，输出完全是另一个档次的东西。用户描述了一个可复现的模式：长会话后模型开始「完全无视你说的话」，但模型选择器上还挂着顶配标签。 [^1]

最荒诞的注脚是，Plus用户160条/3小时用完后自动切换mini的机制，在OpenAI官方文档里被描述为一项「功能」。 [^3]

为什么会这样？Lisan al Gaib分析认为，答案就两个字：省钱。算力与盈利能力的紧缩正影响着每一个人，处处精打细算，不放过任何省钱的机会。 [^1]

然而，就在GPT-5.5用户集体投诉的同一周，GPT-5.6的身影已经出现在了Codex后台日志里。内部代号iris-alpha，150万Token上下文，Polymarket给出的6月发布概率超过85%。 [^1]

一边是5.5用户连基础体验都保不住，一边是5.6已经在后台悄悄跑真实流量。

这就是2026年的ASI竞赛。造新模型的速度越来越快，但让旧模型好好跑完一个会话却越来越难。跑分最强的那一天永远是发布日，之后每一天都是薛定谔的GPT。 [^1]