TL;DR:
小米以近乎疯狂的99%降幅重塑大模型API定价,不仅是对DeepSeek激进策略的跟随,更折射出中国科技巨头在算力制裁背景下追求“极致性价比”的突围逻辑。当硅谷还在讨论如何通过昂贵的订阅变现时,中国厂商正以近乎零成本的调用价格,加速将大模型推向公用事业化的临界点。
在硅谷的算力贵族们还在为下一代模型筹措数以十亿计美元的资本支出时,北京的这场“Token价格战”已然将其置于一种微妙的尴尬境地。当小米宣布其MiMo-V2.5系列API永久降价最高达99%时,这不仅仅是一个简单的市场促销,而是一场关于模型“实用主义”的宣战。如果说过去一年的AI行业是在比拼谁的参数规模更大、谁的幻觉更少,那么现在,战火已经烧到了最核心的地带:谁能让生成式AI廉价到如同自来水一般。
商业模式的倒置与重塑
对于小米而言,这份财报多少显得有些“惨烈”——利润腰斩、营收下滑,却还要硬着头皮向AI赛道抛出600亿元的三年规划。这听起来像是一个典型的财务灾难,但在中国特有的科技竞争语境下,这或许是防御性增长的唯一良药。雷军深谙“互联网思维”的精髓,通过API价格的极端下调,小米试图将MiMo模型变成AI开发者的底层基座。
这种降价策略背后的技术逻辑,不仅是关于SGLang HiCache和多级存储的工程优化,更是对“模型规模”作为商业护城河的否定。当Token成本被压缩至几乎忽略不计,开发者不再需要为“计算力”买单,转而进入了一个模型性能饱和、生态位争夺的新纪元。在这种逻辑下,亏损是短期内必须支付的“入场券”,而目标则是占据全球AI调用量的顶端。
市场格局:高傲的西方与内卷的东方
值得玩味的是,这种分化不仅存在于企业之间,更在地缘政治的缝隙中撕裂出两道风景线。美国巨头如OpenAI、Google维持着高昂且持续上涨的定价体系,依然沉浸在通过垄断性算力获取高毛利的幻想中;而中国厂商则在芯片获取受限、资本市场承压的背景下,走出了一条“以量换价”的倒逼创新之路。
这引出了一个深层的经济学问题:在资源(算力芯片)受限的情况下,为何中国模型的性价比反而反超?答案或许在于,面对制裁带来的“硬约束”,中国团队在推理效率优化和架构精简上展现出了超乎寻常的创造力。这不再是资本密集型的研发竞赛,而是演变成了一场算法工程师与显存管理器的极简主义艺术表演。
投资视角的冷静拷问
然而,这场“降价狂飙”是否具备长期可持续性?资本市场对此无疑是存疑的。虽然小米强调通过技术降低每枚token的服务成本,但这种“零利润”甚至“负利润”的定价模型,在本质上是对AI产业价值链的重组。对于投资者而言,最核心的风险在于,当所有人都将价格卷至地板,大模型的商业化变现路径将彻底从“卖模型”转向“卖应用”或“卖生态”。
如果最终没人能在AI上赚到钱,那么这场持续数年的资本“输血”终将面临枯竭的时刻。但在此之前,正如一位海外网友的冷峻观察所言,中国模型正在让全球AI巨头们估值的泡沫变得愈发难以支撑。在这场技术马拉松中,小米们正在赌的是:在彻底淘汰平庸竞争对手之前,先成为那个拥有最广阔用户基础的“基础设施”。毕竟,在技术创新的前夜,生存权的优先级永远高于利润率。