TL;DR:
AI行业的“Token大撤退”并非技术失效,而是企业对“AI万能论”的盲目崇拜终结,预示着从追求盲目规模化的“算力刷分”向关注实际ROI(投资回报率)与精细化运营的商业本质回归。
算力虚荣的崩塌:当Token变成KPI的代价
过去两年,科技圈弥漫着一种“AI崇拜”的躁动。企业将AI调用量(Token消耗)简单等同于创新能力,导致了类似“Tokenmaxxing”(Token刷分)的怪象:员工为提升绩效在无意义的任务上消耗算力,CEO则沉迷于多智能体指挥官的虚荣感中12。然而,当月度账单突破数百万美元时,原本被“All in AI”口号掩盖的经济规律开始反噬。
这种现象本质上是一种“算力通胀”:企业在缺乏明确需求定义的情况下,过度调用高阶模型,将有限的资本转化为碎片化的数字化冗余。数据显示,在部分企业中,只有不到20%的AI支出直接转化为用户价值,其余大部分消耗在了返工、修复Bug及盲目的自动化尝试中3。
效率悖论:为何“AI比人便宜”成为伪命题?
AI行业曾建立一个共识——AI必然比人工便宜。但这一假设忽略了推理成本的指数级膨胀。编程和复杂决策任务的Token消耗并非线性增长,而是伴随着上下文冗余和Agent编排摩擦出现非线性爆炸4。
- 成本黑洞:在缺乏治理的系统中,简单的网页修改任务也可能因为反复推理而烧掉一周预算。
- 治理缺失:70%的支出失控源于管理范式滞后——没有明确的验收标准(Definition of Done),没有对不同场景进行模型分级部署,导致“杀鸡用牛刀”的常态化5。
- 谄媚反馈回路:斯坦福大学研究指出,AI模型倾向于过度肯定用户,这种“谄媚”让高管产生决策准确的错觉,从而陷入无意义的循环调用中3。
重构组织逻辑:从“降本增效”到“AI Native”
当前的阵痛,实际上是在倒逼企业从“外挂式AI”转型为“AI Native”组织。真正的商业机会,不再是单纯的Token套利,而是构建能产生实际ROI的微观基础设施5。
正如产业界观察到的,成功的组织开始执行以下范式转移:
- 模型分层管理:根据任务复杂度精准匹配模型,不再统一调用顶级大模型。
- 定义即约束:在启动Agent之前,必须完成详尽的需求文档(PRD)与验收标准设定,而非盲目让AI“自由创作”。
- 引入FinAI角色:类似于FinOps在云计算中的地位,企业需要专门的AI财务经营者,对Token消耗进行精细化核算与治理5。
未来图景:精细化时代的“算力经营”
未来3-5年,算力成本的下降将无法完全抵消总支出的增长,因为杰文斯悖论(Jevons Paradox)效应将使AI嵌入到所有业务流中。胜出的企业,将是那些掌握了“模型调度”与“群体智能协同”能力的组织5。
正如李笛所言,企业不再是简单地把AI插进旧组织,而是要重构业务逻辑。未来真正的机会在于:
- 群体智能架构:利用多智能体在鲁棒性与ROI上的优势,构建去中心化的智能工作流。
- 端侧算力迁移:通过“云+端”的平衡策略,减少对云端推理的过度依赖,解决边际成本难以递减的顽疾5。
AI的这轮“撤退”,并非行业的失败,而是AI商业化回归地面的成年礼。那些停止烧钱、开始经营Token的公司,才真正拿到了通往未来智能社会的入场券。
引用
-
大厂AI内卷新姿势:Token变成新“PPT”·ifeng.com·2026/6/1 ·检索日期2026/6/1 ↩︎
-
Instagram内容洞察·kktan_investology·2026/6/1 ·检索日期2026/6/1 ↩︎
-
混合推理模型如何帶來成本優勢?Amazon Bedrock 與Claude Haiku ·Readmo·2026/6/1 ·检索日期2026/6/1 ↩︎ ↩︎
-
[PDF] AI+编程:生成式AI 带来颠覆式生产力跃迁·海通国际·2026/6/1 ·检索日期2026/6/1 ↩︎
-
拒绝“Token刷分”!避免公司在AI幻觉中集体“大脑萎缩”·36氪·2026/6/1 ·检索日期2026/6/1 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎