卖水的炼金术:为何AI推理平台正在吞噬算力经济?

温故智新AIGC实验室

TL;DR:

随着AI行业从“昂贵的训练竞赛”转向“高频的推理调用”,以Fireworks AI为代表的推理平台正凭借“卖水人”的商业模式实现估值飞跃。这不仅标志着算力成本性价比拐点的到来,更预示着AI商业逻辑正从资本密集型转向现金流导向的规模化运营。

在硅谷的淘金热中,最赚钱的往往不是那些挥舞着铁锹(训练模型)的人,而是那些在矿区门口兜售饮用水和铲子(提供推理服务)的商贩。如今,这一逻辑在AI领域得到了极致的印证。以总部位于红木城的Fireworks AI为例,不到两年时间,其估值如同搭上了火箭,从数亿美元狂飙至150亿美元,这背后的叙事逻辑正在从“炼金术”转向“公用事业”。

算力重心的历史性偏移

长期以来,人工智能行业的叙事被大模型训练的巨额账单所统治。当OpenAI和Google在万卡集群上挥金如土时,市场将“模型规模”视为衡量智商的唯一标准。然而,当烟尘散去,真正的战场已经悄然转移。

数据清晰地揭示了这一转变:2023年,训练算力尚占据全球AI算力版图的绝对主导,而到了2026年,推理负载已飙升至训练负载的4.5倍至8倍,成为真正的耗能大户12。如果说大模型训练是昂贵的实验室新品研发,那么推理调用就是走向千家万户的标准化消费品。正如英伟达首席执行官黄仁勋所预见的,推理规模的指数级增长将是未来十年的主旋律。

卖水的商业逻辑

Fireworks AI及其同行——如估值同样高歌猛进的Baseten和Together AI——并非在做模型研发的“加法”,而是在做推理成本的“减法”3。它们通过高效的底层架构优化,让企业无需自行搭建复杂的推理集群即可调用诸如DeepSeek或Llama 3等开源模型,并按Token计费。

这种模式的魔力在于“规模效应”与“边际成本递减”的完美结合。当平台每天处理的Token数以万亿计,其议价能力和基础设施利用率便形成了深厚的护城河。对于Cursor这样的AI编程工具而言,Fireworks AI提供的不仅是API接口,更是其产品体验的底座。换言之,推理平台已经成为了AI时代的“基础设施提供商”,而Token调用则成了新的度量衡。

风险与资本的博弈

当然,狂热的估值背后并非全无隐忧。尽管市销率(P/S)指标在AI泡沫中看起来依然“合理”,但AI基础设施领域正面临严重的同质化竞争。当推理成为公用事业,谁能将单Token成本压至极致,谁就掌握了市场的定价权。

对于投资者而言,这不仅是一场对技术实力的押注,更是对行业整合趋势的远见。随着GPU供应的缓解和推理架构的成熟,这一赛道必将迎来一轮惨烈的整合。那些仅仅作为“API搬运工”的平庸公司,很快就会被更具成本竞争力的技术架构所淘汰。

在这场资本狂欢中,最深刻的洞察或许在于:我们终于从对“超级智能”的幻想中走出来,开始真正计算AI每产生一个字所需的商业成本。毕竟,即使是通向AGI的道路,也必须建立在能够产生稳定现金流的脚手架之上。

引用


  1. 暴涨27倍,一群华人卖Token:年入22亿 · 铅笔道 · 惜文 (2026/5/28) · 检索日期2026/5/28 ↩︎

  2. Fireworks AI正洽谈融资,估值达150亿美元 · 虎嗅网 (2026/5/28) · 检索日期2026/5/28 ↩︎

  3. Fireworks AI Raises $250 Million Series C at $4 Billion Valuation · Orrick (2025/11/1) · 检索日期2026/5/28 ↩︎