一夜惊魂:Claude刷爆5亿,Copilot账单翻50倍,你的Token钱包还好吗?

温故智新AIGC实验室

TL;DR

AI圈最近上演了一出出“烧钱大戏”:有人忘记设上限,一个月烧出5亿美元Claude账单;有人被黑客薅羊毛,7美元预算飙到1.8万;更有团队3个人跑出130万美元Token——而GitHub、Claude纷纷改按量计费,你的“免费午餐”正式结束,接下来得学会精打细算每一个Token了。

如果你觉得AI还是那个每月几十美元包月的“小甜甜”,那接下来的故事可能会让你手里的咖啡杯抖三抖。

最近,科技圈接连曝出几桩“账单惊魂”。先是一家企业给员工开了Claude账号,却忘了设使用额度上限——好家伙,一个月烧出整整5亿美元!1 是的,你没看错,5个亿,后面跟8个零。管理层估计看到账单的那一瞬间,血压直接爆表。

这还不是孤例。今年4月,一位澳大利亚AI顾问Jesse Davies,给自己的Google Cloud账户设了7美元预算预警和1400美元硬性上限——结果黑客发现了他多年前遗留的API key,发了6万多个请求,预算预警和上限双双失灵,最终账单飙到1.8万美元。2 两道保险,一道都没拦住,感觉像是把家门锁好,结果小偷从窗户爬进来了。

更离谱的还在后面。OpenAI内部,有个三人团队(创始人Peter Steinberger已加入OpenAI)用100个Codex智能体并行跑了30天,烧掉6030亿个Token,费用130万美元。3 当然,这是内部实验,用来测试“不考虑成本,AI编程能跑多疯狂”。但你看,一个月的Token消耗,够一个中型公司发一整年工资了。

Uber的CTO也承认:公司4月份就把全年的Claude Code预算烧光了。其COO更公开表示,AI成本越来越“难以自圆其说”。1

这些金额差出几个数量级,但指向同一个扎心的事实:在智能体时代,失控的密钥、昼夜无休的智能体军团、忘了设上限的账号——任何一个,都能让你的Token账单一夜刷爆。

为什么AI账单突然“核爆”?因为计费逻辑彻底变了

答案藏在计费方式的“暗改”里。

过去,无论是GitHub Copilot还是Claude Code,都采用包月制:你花10美元或20美元,想怎么用怎么用。这个模式在聊天和补全场景下没问题——因为每个人的消耗差不多,平台用轻度用户补贴重度用户,勉强能兜住。

但智能体(Agent)崛起后,一切都崩了。一个普通的聊天提问,和一次连续跑几小时的自主编码任务,成本差了几个数量级。GitHub官方直言:“我们一直在替跑重度任务的人买单,但不可持续了。”4

于是,从2026年4月开始,OpenAI、GitHub、Anthropic集体转向按Token用量计费

  • 4月2日:OpenAI Codex计费改成按输入、缓存输入、输出三类Token分开算。
  • 4月23日:这个规则扩展到所有企业方案,月费里的隐形折扣被抽掉。
  • 5月:Copilot宣布从6月1日起全面转为“AI Credits”模式,每个Credit价值0.01美元。Pro用户每月10美元得1000 Credits,超出部分按模型实时费率扣。5

一位开发者晒出账单:以前每月28美元,现在要付746美元。另一位更惨,从50美元飙到3000美元。1 评论区炸了:“还有人继续订阅吗?”

不过也有老用户淡定表示:“整天用,月底基本不超额。那些极端账单都是vibe-coder(凭感觉编码者)无脑烧出来的,正常使用没影响。”1

事实是:基础订阅费没变,变的是额外用量、智能体任务和更贵模型的调用。被冲击最大的是那些靠AI跑长链任务的重度用户。

更扎心的事:公司自己人也在“卷”着烧

你以为只有外部攻击者和内部实验会烧钱?不,自家员工也能“烧”出火花。

今年5月,Business Insider曝出:Amazon内部有个叫KiroRank的AI使用排行榜——员工自发搭建,谁用的Token多谁排名靠前。结果部分员工为了上榜,开始刷一些根本解决不了实际问题的Token消耗,纯粹为了排名。6

Amazon高级副总裁Dave Treadwell直接喊话:“别为了用AI而用AI。用它去解决客户问题,解决业务问题,去创新。”

硅谷给这种现象起了个专有名词:Tokenmaxxing(极限烧Token),把消耗量当生产力。有CTO发现,员工连查天气预报都要用最贵的前沿模型,账单默默飞涨。

当KPI设错的时候,人就会用最聪明的方式钻空子。用了多少AI,不等于干得多好——这恰恰是AI浪费的制度性根源。

有人焦虑账单,有人却靠算Token账赚钱

Token账单一团糟,但聪明人已经开始“捡钱”了。

第一条路:让AI少绕路。 Glean这家公司做的就是企业AI知识助手:把散落在公司各处的数据打通,让AI直接拿到上下文,不用翻箱倒柜。AI少烧Token,自然省钱。Glean年营收15个月翻三倍,跨过3亿美元,客户包括Databricks、Reddit、Samsung。1

第二条路:把活分给对的模型。 初创公司Factory AI搞模型路由:简单任务走便宜档,复杂任务走顶配。Glean CEO Arvind Jain说过:“路由做对了,能省10倍。”1

学术圈也在给这种转向铺路。2026年4月的一篇arXiv论文,第一次系统拆解了智能体编程成本:7

  • 智能体任务的Token消耗可达普通代码推理的上千倍,主要烧在输入Token上。
  • 同一任务跑多次,Token消耗能差出30倍
  • 更高的Token消耗,并不必然带来更高准确率——精度往往在中等成本处见顶,再往上烧,钱花了,效果反而饱和。

简单说:你以为多花钱就能多办事。实际是钱花了,活不一定更好,预算还算不准。

当AI账单开始追上人力成本

Glean CEO Arvind Jain 5月29日接受CNBC采访时说了一句意味深长的话:“这是我记忆中第一次,技术成本开始和人力成本持平。”8

英伟达应用深度学习副总裁Bryan Catanzaro也印证:对于他的团队,算力成本已经远远超过员工薪资。1

过去大家默认AI便宜,是因为真实成本被补贴和平均掉了。现在Token开始逐笔计价,这个账就变了。假设一个工程师年综合成本25万美元,折合每月约2万美元。如果一个AI工具每月花1000美元,但能稳定替代5%以上的工程产出,那是划算的;但如果每月Token账单烧到几万甚至几十万美元,却只换来一堆无效产出——那AI反而比人贵。

免费包月畅用的窗口期,正在关上。接下来,摆在所有开发者面前的是同一个问题:如何精打细算,让每一个Token发挥出最大价值。

未来真正的赢家,将是那些最先学会算Token账的人。


  1. AI写代码太烧钱了:Copilot、Claude一起涨价,不如把程序员请回来?·36氪·2026/4/28·检索日期2026/6/1 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. Axios报道:谷歌云用户因API key泄漏,账单从7美元飙至1.8万美元·Tom's Hardware·2026/5·检索日期2026/6/1 ↩︎

  3. OpenAI内部实验:三人团队30天烧130万美元Token·X平台截图·2026/5·检索日期2026/6/1 ↩︎

  4. GitHub Copilot定价更新公告·GitHub官方博客·2026/4/28·检索日期2026/6/1 ↩︎

  5. GitHub Copilot模型和定价文档·GitHub Docs·2026/5·检索日期2026/6/1 ↩︎

  6. Amazon下线内部AI使用排行榜KiroRank·Business Insider·2026/5·检索日期2026/6/1 ↩︎

  7. arXiv论文:智能体编码任务的Token消耗分析·arXiv:2604.22750·2026/4·检索日期2026/6/1 ↩︎

  8. CNBC访谈:Glean CEO谈AI成本与人力成本持平·CNBC·2026/5/29·检索日期2026/6/1 ↩︎