TL;DR:
最近很多人发现AI越来越“难用”——翻译变梗概、代码出bug、夜里还“降智”。别急着骂它摸鱼,真相可能是:大模型公司为了省钱,偷偷给AI“减了配”。这场价格战背后,是算力成本和商业化的残酷博弈。
最近,社交平台上刮起了一阵“吐槽AI”的妖风。
文字工作者关佳怡发现,以前上传PDF给AI翻译,页面会变成左右两栏,右边原文左边逐句翻译,丝滑得很。现在呢?明确要求逐句翻,结果出来个梗概。1 程序员余京生也崩溃了——以前给ChatGPT提需求,模型会主动尝试不同的解决路径,代码基本能直接用;现在即使描述得极其详细,ChatGPT也像个“机械执行者”,不仅频繁出现语法错误,还死不认错,硬说是硬件环境的问题。1
“总之退化了很多,用Grok和DeepSeek也感觉明显。”余京生说。1
更有付费用户宁泽吐槽:DeepSeek白天写代码一遍过,一到深夜就“降智”,同样难度的代码要反复改好几次,而且两轮前的需求它居然忘了。1
AI,难道真的开始“偷懒”了?
AI的“自辩”:我不是懒,我是有苦衷的
面对铺天盖地的质疑,DeepSeek倒是个老实人。当被问“你是降智了还是偷懒了?”,它思考9秒后给出的回答堪称“职场生存指南”:问题归咎于“算力成本”“安全困境”“迭代阵痛”三方面。1
嗯,翻译成人话就是:公司太穷,服务器太贵,还得防着你乱问问题,再加上版本更新频繁,我太难了。
相比之下,豆包在被质疑翻译偷懒后,倒是立刻“重新干活”,恢复了原来的格式规范。1 这让用户关佳怡又好气又好笑:“这玩意儿也会偷懒,学什么不好!”
Kimi则更理性,将体验变差归因于模型版本更新、上下文复杂度、提示词影响。1
真相大白:不是AI不行了,是公司“没钱”了
资深业内人士一针见血:别怪AI,怪就怪“钱”闹的。
算力成本,像一座大山压在模型公司身上。 赛迪顾问分析师韩子哲指出,除了Transformer架构固有的长文本性能衰减等技术局限,商业考量才是当前多款大模型“降智”的主要原因。1
为了控制成本,厂商们开始偷偷搞“小动作”:
- 动态推理预算:给AI设定一个“思考额度”,花完了就赶紧糊弄过去。
- 缓存优化:能复用旧答案就复用,别老“深度思考”。
- 路由降级:复杂问题丢给小模型处理,能省算力就省。
这种隐性调整,相当于把原来的“四缸发动机”换成了“三缸”,响应速度是快了,但复杂任务的表现直接跳水。1
更致命的是,大模型市场的价格战已经杀红了眼。2026年5月,DeepSeek宣布旗舰模型V4-Pro的API价格永久下降75%;小米紧随其后,最高降价99%。1 这哪是竞争,简直是“自残式”降价。
低价意味着低利润,低利润意味着“没钱上硬件”。极佳视界联合创始人朱政透露:现在租算力卡的等待时间,从去年的一两天延长到一两周都不一定有资源。1 连专业公司都排不上队,普通用户能享受到的算力自然就更少了。
一个扎心的现实是:过去大家用AI主要聊天,消耗算力少;现在大家把AI当“牛马”使,写代码、搞翻译、做PPT,消耗的Token是海量的。 1 算力资源空前紧张,公司只能“拆东墙补西墙”,优先保障基础聊天体验,复杂的活儿能省就省。
新趋势:分层收费,打工人或许该接受“AI分档”
面对“降智”困境,厂商们不是没想办法。
比如DeepSeek新推出的“专家模式”,明确标注“擅长复杂问题,资源紧张,不支持文件上传”。1 翻译过来就是:想让我认真干活?得加钱。
朱政认为,像豆包这类模型开始分层收费,其实是好事。1 对经济条件允许的用户,这能保障专业化需求;对企业来说,能合理分流,保证免费用户的基础聊天不受影响,商业模式也更清晰。
说白了,我们可能正在见证一个“AI分档”时代的到来——免费版是“混日子版”,付费版才是“拼命版”。就像视频网站的会员免广告,未来的AI可能也是:免费用户用“精简版”,付费用户用“豪华版”。
AI的“成长烦恼”:不是它变懒,是它长大了
其实,AI的“降智”体验,某种程度上也是行业发展的必经阶段。
以前AI像刚毕业的“实习生”,充满热情,每个任务都全力以赴;现在它成了“老员工”,见惯了各种需求,学会了“偷懒”,但同时也承载着巨大的商业压力。模型需要兼顾效率、成本和安全性,就像一个打工人在有限工资下要完成无限任务,不划水才怪。
但好消息是,技术仍在迭代。DeepSeek通过MLA注意力机制和MoE专家混合架构,正在大幅压缩推理成本;23 全球CSP厂商的资本支出连年攀升,2025年四大云服务商合计规划支出达3200亿美元。4 算力紧张是暂时的,长期来看,AI能力只会越来越强,价格只会越来越低。
只不过,在这之前,各位打工人可能要忍受一段时间“AI摸鱼”的日子了。下次它偷懒时,别急着骂,不妨默默问一句:“你是不是又没钱交电费了?”