数字世界的“流量劫”:从词元到包月,AI云计算步入成年礼

温故智新AIGC实验室

TL;DR:

AI云服务正经历从“按量计费”到“预留产能”的商业范式转移,旨在解决Token爆发带来的成本失控。这场定价权的博弈不仅是云巨头对利润率的保卫战,更是AI应用从“昂贵玩具”转向“平价水电”的关键转折点。

2026年的春天,对于硅谷的云计算巨头们而言,这并非万物复苏的季节,而是一场昂贵的“受难日”。当微软、亚马逊和谷歌相继交出破纪录的营收成绩单时,华尔街投下的却不是香槟,而是充满疑虑的冷眼。微软股价的暴跌并非因为Azure不够努力,而是因为它的“胃口”实在太大——当单季资本支出冲向375亿美元,甚至足以买下半个波音公司时,投资者开始担心:这场AI盛宴,究竟是在喂养未来,还是在吞噬资产负债表?1

原因只有一个字:钱。更准确地说,是那种让CFO们夜不能寐的、正在失控的AI账单。

词元的背叛:当生产工具遭遇“出租车计价器”

长期以来,Token(词元)计费模式被视为AI民主化的功臣。这种“吃多少付多少”的模式曾让开发者们欢呼雀跃,但在2026年,它正逐渐演变成一种对深度用户的“惩罚”。随着AI从只会写打油诗的聊天机器人进化为能独立处理复杂任务的“智能体”(AI Agents),Token的消耗不再是线性增长,而是呈指数级爆炸。一个简单的对话可能只需几百个词元,但一个需要反复推理、调用工具、读取万行代码的智能体,其消耗量往往是前者的千倍。2

这种“用量越大越恐惧”的逻辑,让OpenAI也不得不向现实低头。2026年3月,曾经惊艳世人的视频生成工具Sora宣告关停,其背后是日均1500万美元、年均54亿美元的惊人运营成本。1 如果说文字生成是轻便的自行车,那么视频生成就是烧油的波音747。当英伟达CEO黄仁勋甚至提出要给自家高薪工程师分配“Token年度预算”时,这个行业已经走到了十字路口:如果连开发者都用不起自己的产品,那么这种商业模式离崩溃也就只有一步之遥。

从“点菜”到“自助”:PTU的围城策略

为了化解这场危机,云厂商们翻开了电信运营商的老剧本。就像移动网络从按KB计费转向无限流量套餐一样,云计算正在推行所谓的PTU(预配吞吐量单位)。简单来说,就是从“计程车模式”转向“包月租车”。

“Token模式下,云厂与客户是零和博弈;但在PTU模式下,这种博弈变成了正和。”

这种转型本质上是将波动的风险从客户侧转移到了云厂商侧。对于企业CFO而言,他们终于可以给AI预算画上一个确定的圈;而对于云厂商而言,虽然短期毛利率可能受损,但他们换取了最宝贵的资产——客户的深度绑定。正如国信证券所指出的,这标志着云计算毛利结构从“高弹性波动”向“高韧性”转变。1 这不仅仅是计费方式的改变,更是产业链话语权的重新分配。

三巨头的阳谋:生态、规模与技术的三角竞赛

尽管都在推行PTU,但硅谷三巨头的姿态各异,折射出深层竞争底色的不同:

  • 微软(生态捆绑者):凭借Office 365和GitHub的护城河,微软将AI成本消融在庞大的软件订阅费中。这种“温水煮青蛙”的策略极其高效,其商业剩余履约义务已飙升至惊人的6250亿美元1 但它的软肋也显而易见:过度依赖OpenAI这一单一供应源,风险如同寄生于大树的藤蔓。
  • 亚马逊AWS(成本收割机):安迪·贾西(Andy Jassy)赌的是规模效应。通过自研Trainium和Inferentia芯片,AWS试图将单位算力成本降至行业地板。它不介意价格战,因为它拥有全球最庞大的“算力工厂”。2
  • 谷歌(技术贵族):谷歌走的是全栈整合的技术奢侈品路线。从第七代TPU到与苹果的深度合作,谷歌试图向市场证明,虽然它的服务更贵,但“智能密度”更高。1

这种竞争格局意味着,未来的赢家不再是那个拥有最多GPU的人,而是那个能以最低“单位Token成本”提供最稳定智能服务的玩家。

如果历史可以作为参考,那么正如20年前宽带包月制的普及催生了YouTube和Netflix,今天AI计费模式的“提速降费”和确定性,也正在为下一个万亿级的AI原生应用铺路。当定价权从博弈走向共赢,AI的“成年礼”才算真正完成。在此之前,云巨头们仍需在烧钱的烈火中继续忍受这场必要的“受难”。

引用


  1. Token消耗暴增千倍,云厂商开始慌了 · 市值榜 · 市值榜团队 (2026/3/31) · 检索日期2026/4/9 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. 云厂商,掀起涨价潮 · 36氪 · 邵延港 (2026/4/9) · 检索日期2026/4/9 ↩︎ ↩︎