价格战终局:小米与DeepSeek构建的“Token通缩”新秩序

温故智新AIGC实验室

TL;DR:

大模型API价格的极速下探并非简单的市场竞争,而是算力利用效率达到临界点后的必然结果。随着国产模型进入“成本竞争”阶段,大模型的价值逻辑已从单纯的性能溢价转向基础设施效能的比拼,这意味着通往AGI的“Token燃料”正在迅速商品化。

算力效率的“摩尔定律”:价格战背后的技术真相

小米MiMo-V2.5系列的降价,并非单纯的商业补贴行为,其核心驱动力在于深度推理系统的工程迭代。通过将KV Cache在GPU、CPU、SSD等多级存储间的数据搬运量削减至原有的1/7,并结合Sliding Window Attention (SWA) 技术,小米实质上突破了传统推理架构的吞吐瓶颈12

这种技术范式与DeepSeek的策略高度重合:通过软硬件协同重构,将推理过程中的无效算力消耗降至最低。当单位Token的推理成本以数量级速度下降时,价格战便不再是简单的“烧钱换流量”,而是对研发效率与架构领先性的直接“降维打击”。

产业格局重构:订阅制的消亡与Token经济学的崛起

从早期的“无限调用”模式到如今精细化的Token计费体系,国内大模型产业正在经历一场残酷的“去泡沫化”过程。随着各大厂商相继下架低价套餐,AI服务的“免费午餐”时代正式终结,市场进入了以算力效率为核心的“工业化生产”阶段3

  • 生态竞争的偏移:当前的竞争焦点已从“参数规模”转向“应用响应效率”与“成本控制能力”。
  • 商业模式的脆弱性:即使在研发投入与Token调用量上双双冲高,厂商的财务模型依然面临严峻考验。正如数据所示,头部厂商在营收增长的同时,净亏损依然维持在数十亿规模34

哲学思辨:技术商品化的利与弊

将API价格压至“地板价”,本质上是推动人工智能成为像电力一样的通用基础设施。对于开发者而言,低成本API意味着海量实验的可能性;但对于行业生态,这种“同质化价格战”可能导致资源过度集中于头部,中小模型厂商的生存空间受到极大挤压。

正如DeepSeek被开发者拥簇为“梁圣”,这种对极致成本优化的崇拜,实际上反映了市场对于AI技术“降本增效”回归本质的渴望。我们正在见证一种新型的数字通缩——模型能力在指数级提升,而调用成本却在趋向零。

未来趋势:从“跑分”转向“价值产出”

未来3-5年,大模型的价格战终将触及物理极限。届时,竞争将不再围绕价格,而是转向:

  1. Agent场景的深度集成:模型能否在复杂、跳步多的实际应用中,实现98%以上的任务成功率3
  2. 算力与能源的耦合:推理效率将直接决定企业在能源稀缺环境下的长期生存能力。
  3. 商业闭环的再造:谁能将Token成本转化为真实的业务价值(而非单纯的流量),谁才能在泡沫破裂后掌握话语权。

引用


  1. 小米MiMo-V2.5系列模型公测:两款全球开源(2026/05/27)·雅虎香港财经·检索日期2026/05/27 ↩︎

  2. 小米MiMo大模型API永久降价:最高降99% 不再区分上下文长度(2026/05/27)·智东西·检索日期2026/05/27 ↩︎

  3. 集体涨价!大模型开始找你“要钱”(2026/05/27)·腾讯新闻·检索日期2026/05/27 ↩︎ ↩︎ ↩︎

  4. 集体涨价,大模型开始找你“要钱”(2026/05/27)·36氪·检索日期2026/05/27 ↩︎