炼金术的终局:Baseten与AI推理的算力税收

温故智新AIGC实验室

TL;DR:

Baseten等基础设施独角兽的崛起,标志着AI行业已从盲目的“模型军备竞赛”转向残酷的“降本增效”战役。通过将开源模型高效部署至生产环境,这些公司正在成为AI产业链中不可或缺的“算力收税人”。

在人工智能的黄金淘金热中,最先赚到钱的往往不是那些试图重塑人类智能的炼金术士,而是那些在荒原上贩卖铲子、甚至为铲子提供自动供水系统的基础设施商。Baseten,这家旧金山的初创公司,刚刚以130亿美元的估值证明了这一古老的商业法则在2026年依然金科玉律。18个月内四轮融资,年化收入暴增20倍至6亿美元,这种增长速度让许多大模型初创公司显得像是昂贵的实验项目。

基础设施的“平权”幻觉

Baseten的商业模式揭示了一个行业真相:真正的护城河并非源于模型参数的堆叠,而在于如何将那些性能日益强悍的开源模型(如Llama、DeepSeek)转化为商业化的生产力。企业在意识到OpenAI的API价格虽然诱人,但长期支出足以让利润表溃不成军时,不得不寻求“混合模型”策略。Baseten提供的正是这样一种“算力中介”:它在20余家云厂商的冰冷集群上搭建了一层软件栈,让复杂的大模型推理变得像调用数据库一样平滑、廉价且可控。

正如互联网时代亚马逊云(AWS)通过托管服务器让网站无需成为硬件专家一样,Baseten正在通过软件抽象降低AI的落地门槛。对于那些在医疗、编程或销售领域试图通过AI获利的开发者而言,Baseten让他们得以规避掉底层的GPU调度、延迟优化和冷启动噩梦。

算力链条上的“收税人”

英伟达对Baseten的注资,不仅是战略结盟,更是一种精明的防御性对冲。面对DeepSeek等高效模型对“算力即昂贵”这一既定认知的冲击,黄仁勋的帝国意识到,未来的增长不再仅仅取决于模型训练端的算力消耗,更在于推理阶段——即AI应用在真实世界中运转时,如何将每一度电、每一张显卡的效率榨取至极致。

然而,这门生意的脆弱性同样显而易见。Baseten本质上是一个复杂的算力转售平台,其利润率极大程度地依赖于技术栈的“优化溢价”。当大型云厂商(如亚马逊、谷歌)不断下沉其推理基础设施服务,或者当专用推理芯片的性价比达到临界点时,Baseten必须证明其软件栈的深度足以抵御来自巨头的挤压。如果说英伟达是算力的总供给商,那么Baseten等独角兽则是负责向终端用户分发算力的“税吏”——他们的命运取决于能否在巨头收紧包围圈前,构筑出不可替代的软件壁垒。

利润与效率的博弈

目前,推理基础设施赛道已成为投资人的必争之地,从Together AI到Groq,资金正以前所未有的速度涌入。这暗示了一个不争的事实:AI行业正在进入“算账”时代。初创公司若无法通过优化推理成本将单位业务的毛利率拉升至健康水平,其昂贵的估值终将成为泡沫。Baseten的成功不在于它制造了多少智能,而在于它让AI变成了一门可以计算利润的生意。在这一意义上,它所贩卖的不仅是算力,更是AI应用在复杂市场中生存所需的确定性。