TL;DR
AI圈最近上演了一出出“烧钱大戏”:有人忘记设上限,一个月烧出5亿美元Claude账单;有人被黑客薅羊毛,7美元预算飙到1.8万;更有团队3个人跑出130万美元Token——而GitHub、Claude纷纷改按量计费,你的“免费午餐”正式结束,接下来得学会精打细算每一个Token了。
如果你觉得AI还是那个每月几十美元包月的“小甜甜”,那接下来的故事可能会让你手里的咖啡杯抖三抖。
最近,科技圈接连曝出几桩“账单惊魂”。先是一家企业给员工开了Claude账号,却忘了设使用额度上限——好家伙,一个月烧出整整5亿美元!1 是的,你没看错,5个亿,后面跟8个零。管理层估计看到账单的那一瞬间,血压直接爆表。
这还不是孤例。今年4月,一位澳大利亚AI顾问Jesse Davies,给自己的Google Cloud账户设了7美元预算预警和1400美元硬性上限——结果黑客发现了他多年前遗留的API key,发了6万多个请求,预算预警和上限双双失灵,最终账单飙到1.8万美元。2 两道保险,一道都没拦住,感觉像是把家门锁好,结果小偷从窗户爬进来了。
更离谱的还在后面。OpenAI内部,有个三人团队(创始人Peter Steinberger已加入OpenAI)用100个Codex智能体并行跑了30天,烧掉6030亿个Token,费用130万美元。3 当然,这是内部实验,用来测试“不考虑成本,AI编程能跑多疯狂”。但你看,一个月的Token消耗,够一个中型公司发一整年工资了。
Uber的CTO也承认:公司4月份就把全年的Claude Code预算烧光了。其COO更公开表示,AI成本越来越“难以自圆其说”。1
这些金额差出几个数量级,但指向同一个扎心的事实:在智能体时代,失控的密钥、昼夜无休的智能体军团、忘了设上限的账号——任何一个,都能让你的Token账单一夜刷爆。
为什么AI账单突然“核爆”?因为计费逻辑彻底变了
答案藏在计费方式的“暗改”里。
过去,无论是GitHub Copilot还是Claude Code,都采用包月制:你花10美元或20美元,想怎么用怎么用。这个模式在聊天和补全场景下没问题——因为每个人的消耗差不多,平台用轻度用户补贴重度用户,勉强能兜住。
但智能体(Agent)崛起后,一切都崩了。一个普通的聊天提问,和一次连续跑几小时的自主编码任务,成本差了几个数量级。GitHub官方直言:“我们一直在替跑重度任务的人买单,但不可持续了。”4
于是,从2026年4月开始,OpenAI、GitHub、Anthropic集体转向按Token用量计费。
- 4月2日:OpenAI Codex计费改成按输入、缓存输入、输出三类Token分开算。
- 4月23日:这个规则扩展到所有企业方案,月费里的隐形折扣被抽掉。
- 5月:Copilot宣布从6月1日起全面转为“AI Credits”模式,每个Credit价值0.01美元。Pro用户每月10美元得1000 Credits,超出部分按模型实时费率扣。5
一位开发者晒出账单:以前每月28美元,现在要付746美元。另一位更惨,从50美元飙到3000美元。1 评论区炸了:“还有人继续订阅吗?”
不过也有老用户淡定表示:“整天用,月底基本不超额。那些极端账单都是vibe-coder(凭感觉编码者)无脑烧出来的,正常使用没影响。”1
事实是:基础订阅费没变,变的是额外用量、智能体任务和更贵模型的调用。被冲击最大的是那些靠AI跑长链任务的重度用户。
更扎心的事:公司自己人也在“卷”着烧
你以为只有外部攻击者和内部实验会烧钱?不,自家员工也能“烧”出火花。
今年5月,Business Insider曝出:Amazon内部有个叫KiroRank的AI使用排行榜——员工自发搭建,谁用的Token多谁排名靠前。结果部分员工为了上榜,开始刷一些根本解决不了实际问题的Token消耗,纯粹为了排名。6
Amazon高级副总裁Dave Treadwell直接喊话:“别为了用AI而用AI。用它去解决客户问题,解决业务问题,去创新。”
硅谷给这种现象起了个专有名词:Tokenmaxxing(极限烧Token),把消耗量当生产力。有CTO发现,员工连查天气预报都要用最贵的前沿模型,账单默默飞涨。
当KPI设错的时候,人就会用最聪明的方式钻空子。用了多少AI,不等于干得多好——这恰恰是AI浪费的制度性根源。
有人焦虑账单,有人却靠算Token账赚钱
Token账单一团糟,但聪明人已经开始“捡钱”了。
第一条路:让AI少绕路。 Glean这家公司做的就是企业AI知识助手:把散落在公司各处的数据打通,让AI直接拿到上下文,不用翻箱倒柜。AI少烧Token,自然省钱。Glean年营收15个月翻三倍,跨过3亿美元,客户包括Databricks、Reddit、Samsung。1
第二条路:把活分给对的模型。 初创公司Factory AI搞模型路由:简单任务走便宜档,复杂任务走顶配。Glean CEO Arvind Jain说过:“路由做对了,能省10倍。”1
学术圈也在给这种转向铺路。2026年4月的一篇arXiv论文,第一次系统拆解了智能体编程成本:7
- 智能体任务的Token消耗可达普通代码推理的上千倍,主要烧在输入Token上。
- 同一任务跑多次,Token消耗能差出30倍。
- 更高的Token消耗,并不必然带来更高准确率——精度往往在中等成本处见顶,再往上烧,钱花了,效果反而饱和。
简单说:你以为多花钱就能多办事。实际是钱花了,活不一定更好,预算还算不准。
当AI账单开始追上人力成本
Glean CEO Arvind Jain 5月29日接受CNBC采访时说了一句意味深长的话:“这是我记忆中第一次,技术成本开始和人力成本持平。”8
英伟达应用深度学习副总裁Bryan Catanzaro也印证:对于他的团队,算力成本已经远远超过员工薪资。1
过去大家默认AI便宜,是因为真实成本被补贴和平均掉了。现在Token开始逐笔计价,这个账就变了。假设一个工程师年综合成本25万美元,折合每月约2万美元。如果一个AI工具每月花1000美元,但能稳定替代5%以上的工程产出,那是划算的;但如果每月Token账单烧到几万甚至几十万美元,却只换来一堆无效产出——那AI反而比人贵。
免费包月畅用的窗口期,正在关上。接下来,摆在所有开发者面前的是同一个问题:如何精打细算,让每一个Token发挥出最大价值。
未来真正的赢家,将是那些最先学会算Token账的人。
-
AI写代码太烧钱了:Copilot、Claude一起涨价,不如把程序员请回来?·36氪·2026/4/28·检索日期2026/6/1 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
-
Axios报道:谷歌云用户因API key泄漏,账单从7美元飙至1.8万美元·Tom's Hardware·2026/5·检索日期2026/6/1 ↩︎
-
OpenAI内部实验:三人团队30天烧130万美元Token·X平台截图·2026/5·检索日期2026/6/1 ↩︎
-
GitHub Copilot定价更新公告·GitHub官方博客·2026/4/28·检索日期2026/6/1 ↩︎
-
GitHub Copilot模型和定价文档·GitHub Docs·2026/5·检索日期2026/6/1 ↩︎
-
Amazon下线内部AI使用排行榜KiroRank·Business Insider·2026/5·检索日期2026/6/1 ↩︎
-
arXiv论文:智能体编码任务的Token消耗分析·arXiv:2604.22750·2026/4·检索日期2026/6/1 ↩︎
-
CNBC访谈:Glean CEO谈AI成本与人力成本持平·CNBC·2026/5/29·检索日期2026/6/1 ↩︎