价格战终局：小米与DeepSeek构建的“Token通缩”新秩序

TL;DR：

大模型API价格的极速下探并非简单的市场竞争，而是算力利用效率达到临界点后的必然结果。随着国产模型进入“成本竞争”阶段，大模型的价值逻辑已从单纯的性能溢价转向基础设施效能的比拼，这意味着通往AGI的“Token燃料”正在迅速商品化。

算力效率的“摩尔定律”：价格战背后的技术真相

小米MiMo-V2.5系列的降价，并非单纯的商业补贴行为，其核心驱动力在于深度推理系统的工程迭代。通过将KV Cache在GPU、CPU、SSD等多级存储间的数据搬运量削减至原有的1/7，并结合Sliding Window Attention (SWA) 技术，小米实质上突破了传统推理架构的吞吐瓶颈¹²。

这种技术范式与DeepSeek的策略高度重合：通过软硬件协同重构，将推理过程中的无效算力消耗降至最低。当单位Token的推理成本以数量级速度下降时，价格战便不再是简单的“烧钱换流量”，而是对研发效率与架构领先性的直接“降维打击”。

产业格局重构：订阅制的消亡与Token经济学的崛起

从早期的“无限调用”模式到如今精细化的Token计费体系，国内大模型产业正在经历一场残酷的“去泡沫化”过程。随着各大厂商相继下架低价套餐，AI服务的“免费午餐”时代正式终结，市场进入了以算力效率为核心的“工业化生产”阶段³。

生态竞争的偏移：当前的竞争焦点已从“参数规模”转向“应用响应效率”与“成本控制能力”。
商业模式的脆弱性：即使在研发投入与Token调用量上双双冲高，厂商的财务模型依然面临严峻考验。正如数据所示，头部厂商在营收增长的同时，净亏损依然维持在数十亿规模³⁴。

哲学思辨：技术商品化的利与弊

将API价格压至“地板价”，本质上是推动人工智能成为像电力一样的通用基础设施。对于开发者而言，低成本API意味着海量实验的可能性；但对于行业生态，这种“同质化价格战”可能导致资源过度集中于头部，中小模型厂商的生存空间受到极大挤压。

正如DeepSeek被开发者拥簇为“梁圣”，这种对极致成本优化的崇拜，实际上反映了市场对于AI技术“降本增效”回归本质的渴望。我们正在见证一种新型的数字通缩——模型能力在指数级提升，而调用成本却在趋向零。

未来趋势：从“跑分”转向“价值产出”

未来3-5年，大模型的价格战终将触及物理极限。届时，竞争将不再围绕价格，而是转向：

Agent场景的深度集成：模型能否在复杂、跳步多的实际应用中，实现98%以上的任务成功率³。
算力与能源的耦合：推理效率将直接决定企业在能源稀缺环境下的长期生存能力。
商业闭环的再造：谁能将Token成本转化为真实的业务价值（而非单纯的流量），谁才能在泡沫破裂后掌握话语权。

引用

小米MiMo-V2.5系列模型公测：两款全球开源（2026/05/27）·雅虎香港财经·检索日期2026/05/27 ↩︎
小米MiMo大模型API永久降价：最高降99% 不再区分上下文长度（2026/05/27）·智东西·检索日期2026/05/27 ↩︎
集体涨价！大模型开始找你“要钱”（2026/05/27）·腾讯新闻·检索日期2026/05/27 ↩︎ ↩︎ ↩︎
集体涨价，大模型开始找你“要钱”（2026/05/27）·36氪·检索日期2026/05/27 ↩︎