算力并非廉价的午餐:大模型的“断奶期”与现实主义转身

温故智新AIGC实验室

TL;DR:

随着电力账单与算力成本的指数级攀升,国产大模型正集体告别“烧钱换增长”的幻梦,通过阶梯定价与“哑铃型”分层重塑商业边界。这不仅是一场价格保卫战,更是行业从“技术崇拜”向“投资回报率”回归的成年礼,预示着AI竞争已进入以盈亏平衡为准绳的下半场。

如果说过去两年的大模型热潮是一场由风险投资赞助、全民参与的免费盛宴,那么现在,侍者正带着账单悄然走近桌边。2026年春季,中国人工智能产业吹起了一股冷峻的现实主义之风。腾讯云官宣其AI算力产品价格将于5月上调5%[^2];智谱GLM紧随其后,不仅调高了API调用定价,其Coding Plan的涨幅更是在30%至100%之间跃动[^1][^3]。对于那些习惯了在提示词框里予取予求的用户来说,这无异于一场清晨的冷水浴:免费AI的黄金时代,似乎正加速进入倒计时。

能量守恒与钱包赤字

经济学的第一定律是“天下没有免费的午餐”,而AI的第一定律或许是“每一个聪明的回答都伴随着热力学的代价”。大模型并非生长在云端的一层薄雾,而是由昂贵的硅片、轰鸣的散热系统以及庞大的电网支撑的重资产行业。加拿大皇家科学院院士李明指出,传统谷歌搜索的单次耗电约为0.3瓦时,足以被广告收入覆盖;而一次AI推理(query)的耗电量则飙升至18瓦时,足足翻了60倍[^2]。

这种成本结构决定了AI公司无法重演互联网时代的“流量变现”旧剧本。当训练一个像GPT-4规模的模型需要消耗相当于130户美国普通家庭一年的用电量时[^2],任何试图维持“全免费、无分层”模式的行为,在财务报表看来都更像是一种缓慢的自杀。智谱CEO张鹏将涨价定性为“回归正常的商业价值”[^2],这不仅是企业的自辩,更是对算力稀缺这一物理现实的妥协。在供需失衡的结构性压力下,涨价反倒成了保障服务稳定性的最后一道防线[^1]。

从流量迷信到利润教条

资本市场的耐心正像数据中心的冷却液一样迅速挥发。一级市场对AI的审美已从“模型参数”转向“年度经常性收入(ARR)”与“毛利率”[^2]。在这种背景下,一种被称为“哑铃型”的商业范式正成为行业共识:一头是维持基本流量的轻量级免费模型,另一头则是按Token计费、针对复杂需求的“专家模式”[^2]。

DeepSeek近期上线的“专家模式”分流[^2],以及阿里千问升级的付费财经分析模块,都是这种逻辑的延伸。这种策略极为机智:它既保留了作为获客入口的“免费”诱饵,又通过产品分层锁定了高净值客户。MiniMax推出的轻量级M2.5模型则尝试从另一维度破局——通过极度克制的10B激活参数实现高吞吐推理,试图以更高的能效比在实时编程等细分赛道抢占身位[^3]。这不仅是技术路径的选择,更是对部署成本的一次精准狙击。

幸存者游戏的下半场

大模型厂商的这轮集体调价,标志着行业正式从“军备竞赛”进入“阵地防御”。根据世界半导体贸易统计组织(WSTS)的预测,2026年全球半导体市场将因AI需求维持高位增长,这意味着上游算力成本在短期内难见天日[^1]。对于国产“AI六小虎”而言,海外版GLM-5的价格上浮甚至高于国内[^1],显示出中国厂商正试图通过全球化布局来对冲国内市场的价格内卷。

然而,涨价本身是一把双刃剑。付费模式能否走通,最终取决于模型能力能否跨越“有用”到“不可或缺”的鸿沟。正如诺安基金的观察所言,国产大模型的技术能力提升是调价的基础[^2];但如果模型的进化速度追不上价格的涨幅,用户可能会迅速从“惊艳”转为“精算”。在未来的AI图景中,那些无法实现商业闭环、仅靠烧钱维持算力供给的玩家,终将在不断翻倍的电力账单面前,被迫从棋盘上撤回。

AI不生产粮食或钢铁,它的生命力源于它所能创造的溢价[^2]。当潮水退去,我们发现大模型不再是普惠的数字阳光,而是一种昂贵的精炼能源。这场关于价格的校准,实际上是在重新定义AI在人类生产力序列中的位置:它不再是一个免费的玩伴,而是一个计费精准、身价不菲的高级顾问。