硅谷的余震：小米在API价格战中试图“重新定义”AI的底价

TL;DR：

小米宣布大模型API大幅降价高达99%，正式将算力竞赛引入“去利润化”的深水区。这一激进的定价策略标志着大模型行业已彻底告别粗放补贴时代，转向依靠技术效率与规模效应博弈的“血腥”存量竞争。

人工智能领域的金律似乎正在经历一场重构：如果说过去的一年是各家厂商通过烧钱换取“认知度”的狂欢，那么今年五月，这场盛宴的账单已然摆在了每一位首席财务官的桌上。当DeepSeek以令人咋舌的定价逻辑席卷开发者社区，小米紧随其后，将旗下MiMo-V2.5系列API调价至“地板价”，最高降幅触及99%¹²。这不仅仅是一次促销，更是一场关于大模型商业模式生存法则的宣战。

算力通胀与利润贫困

在硅谷的巨头们还在致力于通过高额订阅费维持其高毛利叙事时，中国的大模型玩家们似乎选择了一条更为“凶险”的道路——将Token的价格打入泥土。对于大模型厂商而言，算力是其昂贵的“石油”，但当下的市场现状却是：Token的供应量正以几何级数增长，而能够产生直接利润的商业场景却依然寥若晨星。

小米此番调整，逻辑清晰得近乎残酷：放弃区分上下文窗口的繁琐定价，通过优化Token Plan计费体系，试图在开发者生态中建立“高性价比”的护城河¹³。这种策略的底气，很大程度上源于罗福莉团队在专家混合架构（MoE）上的精进，通过降低每次查询的有效参数量，从而在性能与成本之间找到了微妙的平衡³²。然而，这种平衡极其脆弱。当DeepSeek在业界赢得“梁圣”称号的同时，整个行业也在不断拷问：当API价格跌至仅够覆盖电费与芯片折旧时，创新的动力源泉究竟在哪里？

从“炼金术”到“制造业”

过去几年，人工智能被描绘成一种近乎神秘的数字炼金术，而今，它正被迫向传统的制造业转型——通过极限压低生产边际成本，以求在同质化的红海中分得一杯羹。国内市场的K型分化愈发明显：阿里云、字节跳动与小米等玩家选择了通过通用模型降价走量以锁定开发者入口，而智谱、腾讯等则更倾向于深耕企业定制市场，试图在B端溢价中寻求避难所¹。

这种分化映射出行业对于“AI商业化”的焦虑与共识：Token本身不代表收益，它只是投入的度量衡²。当字节跳动旗下的豆包尝试试水收费却遭遇舆论反弹时，市场已经给出了明确信号——用户对于AI的“低价预期”已被彻底固化²。对于企业而言，如果无法在API调用之外提供深度的业务价值，那么单纯的“降价抢跑”最终只会演变成一场所有参与者都输掉利润的“囚徒困境”。

谁是最终的获益者？

在这场价格博弈中，真正受益的或许并不是各大模型厂商，而是那些能够利用这些便宜算力构建出实际商业闭环的开发者。当推理成本暴跌67%以上时，过去被算力成本所阻碍的复杂智能体（Agent）开发变得触手可及¹²。

但这注定是一个残酷的整合周期。正如雷军所承诺的600亿元AI投入，资本的涌入为这场价格战争提供了持续的燃料，但也让行业内部的洗牌变得不可避免¹。正如所有成熟的市场一样，AI产业最终将抛弃那些仅依靠“堆参数”和“烧补贴”的平庸者，只有那些在底层算法优化与高性能推理上建立起真正壁垒的公司，才能在下一轮估值泡沫破裂后依然屹立不倒。在这场关于算力与生态的“军备竞赛”中，唯有利润与效率，才是衡量赢家的最终天平。

引用

MiMo-V2.5系列API永久降价最高降幅达99%·财联社·宋佳楠（2026/5/27）·检索日期2026/5/27 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
集体涨价！大模型开始找你“要钱”·腾讯新闻·智东西（2026/5/26）·检索日期2026/5/27 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
如何评价小米mimo-V2.5 系列模型5月27日大降价？·知乎（2026/5/27）·检索日期2026/5/27 ↩︎ ↩︎