TL;DR:
5月29日下午,DeepSeek用户发现“重新生成”和“修改消息”居然有次数限制了,普通对话点3到6次就歇菜。官方没发公告,但“半官方”账号紧急回应:别慌,算力扛不住了,只是临时措施。说白了,用户暴涨、服务器要炸,DeepSeek只能先砍掉最耗算力的功能,保住基础对话。至于什么时候恢复?得等华为昇腾950新卡下半年到位。
一觉醒来,DeepSeek居然“限次数”了?
5月29日下午,朋友圈和社群里炸了锅——DeepSeek的“重新生成”和“修改消息”按钮,突然像被施了定身咒,点几下就弹出“已达上限”。
有网友实测:普通对话里,重新生成3到6次就凉凉;专家模式更抠门,大概只给3次。修改输入的上限是6次。
这感觉就像你正跟AI聊得火热,突然对方说“今天话题额度用完,明天再来”——关键还没提前通知!
小红书上的“半官方账号”白墙赶紧灭火:别慌,这只是临时限流,不是负优化,不是要收费。原因很简单——用户太多了,算力顶不住。
算力告急,DeepSeek的“滑铁卢”不是第一次了
DeepSeek这段时间用户量涨得有多猛?看看OpenRouter监测数据:上周全球AI大模型总调用量28.9万亿Token,中国大模型周调用量达9.22万亿Token,环比激增19.89%,连续四周超越美国。而DeepSeek-V4-Flash单周调用量3.43万亿Token,环比暴涨66%,登顶全球榜首1。
用户疯狂涌入的同时,服务器压力像雪球一样滚大。你以为点一下“重新生成”只是刷新页面?对服务器来说,这是一次全新的推理——模型要重新处理上下文、生成答案。修改消息也一样,问题变了,模型就得重新跑一遍推理。
当几十万用户同时把“重新生成”当抽卡按钮疯狂点击,DeepSeek的算力资源就像春运期间的12306——直接崩给你看。
这不是DeepSeek第一次“生病”了。2026年以来,它已经出现18次部分性能异常,本月的第5次就在5月28日上午1。专家模式文件上传下架、智能搜索功能关闭、“服务器繁忙”弹窗——都是算力紧张的老配方。
同行都这么干,但DeepSeek的“沉默”更扎心
其实DeepSeek不是第一家限流的AI公司。ChatGPT一直有消息上限,免费用户用完后会被切到轻量模型;Claude也会根据算力状况动态调整使用额度;Sora、Gemini等图像视频工具在高峰期都收紧过生成次数。
每一次推理都有成本——这已经是行业共识。DeepSeek限制的不是基础对话,而是那些最耗算力的高频操作:重新生成、反复修改、文件上传、联网搜索。
但问题出在“怎么限”。在没有公告的情况下突然对用户说“不”,大家的第一反应当然是“是不是要收费了?” 用户从尝鲜工具变成日常依赖,稳定性和透明度就成了底线。哪怕你在弹窗里放一句“当前服务压力较大,请稍后再试”,也比沉默强一百倍。
700亿融资+国产算力,DeepSeek的“续命药”在路上
半官方账号白墙透露了一个关键信息:华为昇腾超节点的新卡正在部署中,预计下半年上线,届时算力会大幅扩容,这些临时限制大概率会取消2。
与此同时,DeepSeek正被曝出计划融资500亿元(也有说700亿的),腾讯、阿里等巨头正在洽谈投资,融前估值约3000亿元3。梁文锋那个“技术理想主义”团队,终于开始打开外部资本的大门。
为什么突然需要这么多钱?因为V4之后的竞争形态变重了:算力基础设施、人才激励、商业化落地,都需要比过去更稳定的资本安排。DeepSeek V4发布时官方就坦白:“受限于高端算力,目前Pro版服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro价格会大幅下调。”2 模型降价和国产算力部署直接绑定了。
所以你看,这次“限制重生”不是一次孤立的技术事故,而是DeepSeek从“轻资产技术公司”向“重资产基础设施公司”转型过程中的一次阵痛。用户暴涨、算力掐脖、融资到位、国产芯片上车——四个齿轮正在咬合。
DeepSeek要知道:有很多人正在等你
用户生气的不是限制本身,而是“被通知”的方式。大家习惯了DeepSeek的免费、好用、无限度,突然被卡脖子,情绪反弹是自然的。
但换个角度想:如果DeepSeek还是那个200人的小团队,如果融资迟迟不到位,如果华为的昇腾下半年才上线,那这段时间的“限流”就是生存策略。基础对话保住→用户不流失→等算力补上→恢复功能→继续增长。
哪怕只是给个准信:“我们正在扩容,预计X月恢复”——用户会更容易接受。沉默是大忌。
700亿融资赶紧到位吧,DeepSeek,你的用户等着呢。