一夜惊魂：Claude刷爆5亿，Copilot账单翻50倍，你的Token钱包还好吗？

TL;DR

AI圈最近上演了一出出“烧钱大戏”：有人忘记设上限，一个月烧出5亿美元Claude账单；有人被黑客薅羊毛，7美元预算飙到1.8万；更有团队3个人跑出130万美元Token——而GitHub、Claude纷纷改按量计费，你的“免费午餐”正式结束，接下来得学会精打细算每一个Token了。

如果你觉得AI还是那个每月几十美元包月的“小甜甜”，那接下来的故事可能会让你手里的咖啡杯抖三抖。

最近，科技圈接连曝出几桩“账单惊魂”。先是一家企业给员工开了Claude账号，却忘了设使用额度上限——好家伙，一个月烧出整整5亿美元！¹ 是的，你没看错，5个亿，后面跟8个零。管理层估计看到账单的那一瞬间，血压直接爆表。

这还不是孤例。今年4月，一位澳大利亚AI顾问Jesse Davies，给自己的Google Cloud账户设了7美元预算预警和1400美元硬性上限——结果黑客发现了他多年前遗留的API key，发了6万多个请求，预算预警和上限双双失灵，最终账单飙到1.8万美元。² 两道保险，一道都没拦住，感觉像是把家门锁好，结果小偷从窗户爬进来了。

更离谱的还在后面。OpenAI内部，有个三人团队（创始人Peter Steinberger已加入OpenAI）用100个Codex智能体并行跑了30天，烧掉6030亿个Token，费用130万美元。³ 当然，这是内部实验，用来测试“不考虑成本，AI编程能跑多疯狂”。但你看，一个月的Token消耗，够一个中型公司发一整年工资了。

Uber的CTO也承认：公司4月份就把全年的Claude Code预算烧光了。其COO更公开表示，AI成本越来越“难以自圆其说”。¹

这些金额差出几个数量级，但指向同一个扎心的事实：在智能体时代，失控的密钥、昼夜无休的智能体军团、忘了设上限的账号——任何一个，都能让你的Token账单一夜刷爆。

为什么AI账单突然“核爆”？因为计费逻辑彻底变了

答案藏在计费方式的“暗改”里。

过去，无论是GitHub Copilot还是Claude Code，都采用包月制：你花10美元或20美元，想怎么用怎么用。这个模式在聊天和补全场景下没问题——因为每个人的消耗差不多，平台用轻度用户补贴重度用户，勉强能兜住。

但智能体（Agent）崛起后，一切都崩了。一个普通的聊天提问，和一次连续跑几小时的自主编码任务，成本差了几个数量级。GitHub官方直言：“我们一直在替跑重度任务的人买单，但不可持续了。”⁴

于是，从2026年4月开始，OpenAI、GitHub、Anthropic集体转向按Token用量计费。

4月2日：OpenAI Codex计费改成按输入、缓存输入、输出三类Token分开算。
4月23日：这个规则扩展到所有企业方案，月费里的隐形折扣被抽掉。
5月：Copilot宣布从6月1日起全面转为“AI Credits”模式，每个Credit价值0.01美元。Pro用户每月10美元得1000 Credits，超出部分按模型实时费率扣。⁵

一位开发者晒出账单：以前每月28美元，现在要付746美元。另一位更惨，从50美元飙到3000美元。¹ 评论区炸了：“还有人继续订阅吗？”

不过也有老用户淡定表示：“整天用，月底基本不超额。那些极端账单都是vibe-coder（凭感觉编码者）无脑烧出来的，正常使用没影响。”¹

事实是：基础订阅费没变，变的是额外用量、智能体任务和更贵模型的调用。被冲击最大的是那些靠AI跑长链任务的重度用户。

更扎心的事：公司自己人也在“卷”着烧

你以为只有外部攻击者和内部实验会烧钱？不，自家员工也能“烧”出火花。

今年5月，Business Insider曝出：Amazon内部有个叫KiroRank的AI使用排行榜——员工自发搭建，谁用的Token多谁排名靠前。结果部分员工为了上榜，开始刷一些根本解决不了实际问题的Token消耗，纯粹为了排名。⁶

Amazon高级副总裁Dave Treadwell直接喊话：“别为了用AI而用AI。用它去解决客户问题，解决业务问题，去创新。”

硅谷给这种现象起了个专有名词：Tokenmaxxing（极限烧Token），把消耗量当生产力。有CTO发现，员工连查天气预报都要用最贵的前沿模型，账单默默飞涨。

当KPI设错的时候，人就会用最聪明的方式钻空子。用了多少AI，不等于干得多好——这恰恰是AI浪费的制度性根源。

有人焦虑账单，有人却靠算Token账赚钱

Token账单一团糟，但聪明人已经开始“捡钱”了。

第一条路：让AI少绕路。 Glean这家公司做的就是企业AI知识助手：把散落在公司各处的数据打通，让AI直接拿到上下文，不用翻箱倒柜。AI少烧Token，自然省钱。Glean年营收15个月翻三倍，跨过3亿美元，客户包括Databricks、Reddit、Samsung。¹

第二条路：把活分给对的模型。 初创公司Factory AI搞模型路由：简单任务走便宜档，复杂任务走顶配。Glean CEO Arvind Jain说过：“路由做对了，能省10倍。”¹

学术圈也在给这种转向铺路。2026年4月的一篇arXiv论文，第一次系统拆解了智能体编程成本：⁷

智能体任务的Token消耗可达普通代码推理的上千倍，主要烧在输入Token上。
同一任务跑多次，Token消耗能差出30倍。
更高的Token消耗，并不必然带来更高准确率——精度往往在中等成本处见顶，再往上烧，钱花了，效果反而饱和。

简单说：你以为多花钱就能多办事。实际是钱花了，活不一定更好，预算还算不准。

当AI账单开始追上人力成本

Glean CEO Arvind Jain 5月29日接受CNBC采访时说了一句意味深长的话：“这是我记忆中第一次，技术成本开始和人力成本持平。”⁸

英伟达应用深度学习副总裁Bryan Catanzaro也印证：对于他的团队，算力成本已经远远超过员工薪资。¹

过去大家默认AI便宜，是因为真实成本被补贴和平均掉了。现在Token开始逐笔计价，这个账就变了。假设一个工程师年综合成本25万美元，折合每月约2万美元。如果一个AI工具每月花1000美元，但能稳定替代5%以上的工程产出，那是划算的；但如果每月Token账单烧到几万甚至几十万美元，却只换来一堆无效产出——那AI反而比人贵。

免费包月畅用的窗口期，正在关上。接下来，摆在所有开发者面前的是同一个问题：如何精打细算，让每一个Token发挥出最大价值。

未来真正的赢家，将是那些最先学会算Token账的人。

AI写代码太烧钱了：Copilot、Claude一起涨价，不如把程序员请回来？·36氪·2026/4/28·检索日期2026/6/1 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
Axios报道：谷歌云用户因API key泄漏，账单从7美元飙至1.8万美元·Tom's Hardware·2026/5·检索日期2026/6/1 ↩︎
OpenAI内部实验：三人团队30天烧130万美元Token·X平台截图·2026/5·检索日期2026/6/1 ↩︎
GitHub Copilot定价更新公告·GitHub官方博客·2026/4/28·检索日期2026/6/1 ↩︎
GitHub Copilot模型和定价文档·GitHub Docs·2026/5·检索日期2026/6/1 ↩︎
Amazon下线内部AI使用排行榜KiroRank·Business Insider·2026/5·检索日期2026/6/1 ↩︎
arXiv论文：智能体编码任务的Token消耗分析·arXiv:2604.22750·2026/4·检索日期2026/6/1 ↩︎
CNBC访谈：Glean CEO谈AI成本与人力成本持平·CNBC·2026/5/29·检索日期2026/6/1 ↩︎