订阅制的黄昏:AI商业模式正从“流量收割”转向“效能博弈”

温故智新AIGC实验室

TL;DR:

大模型厂商长期推行的“固定月费”订阅制在Agent时代正面临严重的成本倒挂,行业正从盲目扩产的“流量补贴”迅速向精细化的“按量计费(Token Plan)”转型。这一范式转移不仅是财务上的止损,更标志着AI价值评估标准从“能力覆盖面”转向“执行效率与结果可衡量性”。

从SaaS逻辑到AI黑洞:订阅制的底层危机

过去两年,OpenAI与Anthropic依靠200美元的月费套餐,在C端快速跑马圈地,成功将大模型包装成了人人可及的“超级助手”。然而,这一模式直接沿用了软件即服务(SaaS)时代的定价假设:认为通过大量轻度用户的“买单”,可以填补极少数重度用户产生的成本缺口。

但在Agent(智能体)崛起的背景下,这种经济模型彻底崩塌了。正如SemiAnalysis报告所揭示,当用户从简单的对话交互转向多步骤、长上下文的编程与自动化Agent工作流时,Token消耗量呈指数级上升。对于重度用户,其理论成本甚至高达订阅费的70倍1。这种“服务得越多,亏得越惨”的结构性悖论,本质上是SaaS的“零边际交付成本”逻辑与AI推理的高额“算力消耗成本”之间的不可调和矛盾。

技术范式的重构:为什么Coding成了试金石

为什么AI厂商纷纷在Coding领域激进调整定价策略?答案在于“可度量性”。

不同于模糊的创意写作,AI编程任务的结果是二进制的——代码要么运行成功,要么报错。这种任务的确定性使得企业可以精确计算ROI(投入产出比)。随着OpenClaw等Agent框架的普及,调用模式不再是连贯的对话,而是碎片化、高频的复杂指令调用,这直接打破了云厂商赖以生存的缓存优化机制。

当成本压力传导至算力底层,行业出现了一种“反向内卷”:一方面是OpenAI与Anthropic不得不面对巨额亏损并尝试收回折扣;另一方面,DeepSeek等厂商通过极致的架构优化(如GRPO算法与MoE模型),证明了降低推理成本才是下一阶段竞争的胜负手2

未来图景:从“算力出租”到“结果支付”

当前行业正处于从“固定包月”向“按量计费(Token Plan)”过渡的阵痛期,但这不是终局。我们正迈向一个更高级的商业形态:按结果付费(Pay-per-Outcome)

在未来3-5年,AI的商业逻辑将发生以下演变:

  • 定价权分离:简单任务(Chatbot)将趋近于免费或极低成本,而涉及逻辑推理、代码生成与决策的复杂Agent能力,将成为溢价的核心。
  • 计算效率成为核心竞争力:不再是“参数越大越好”,而是“完成同等任务消耗的Token越少越强”。正如GPT-5.5强调更少的Token消耗量与更高的准确率并重,计算效率将直接决定毛利率的高低3
  • 云厂商的回归:对于阿里云、腾讯云等基础设施厂商而言,这标志着他们回到了最擅长的领域——通过计量计费系统管理算力分发,而非在亏损的订阅服务中苦苦支撑。

结语:理性的回归

正如云服务历史上经历过的从“资源租赁”到“Serverless”的进化,AI产业正在剔除“补贴换增长”的泡沫。随着模型能力趋于同质化,能够真正为用户创造可量化价值、且能在单位任务上实现极低算力消耗的厂商,才能在这一场算力与资本的耐力赛中胜出。

对于用户而言,AI的使用门槛或许会提高,但那种“由于无限额度导致效率低下”的模式终将终结;对于行业而言,这不仅是商业模式的修正,更是通向真正AGI商业化的必经之路。

引用


  1. 大模型订阅模式的成本困境分析 · SemiAnalysis(2026/6/17)· 检索日期2026/6/17 ↩︎

  2. DeepSeek V4与推理成本的行业冲击 · 36氪 · 郑丽媛(2026/6/17)· 检索日期2026/6/17 ↩︎

  3. AI Coding竞争与Token Plan的商业演进 · 新立场Pro(2026/6/17)· 检索日期2026/6/17 ↩︎