TL;DR:
曾被视为新时代“免费午餐”的大模型服务,正经历一场微妙的价格“回潮”。在算力、数据与人才成本高企的压力下,厂商们被迫从不计成本的烧钱竞赛转向追求可持续的商业利润,预示着AI商业模式将从单纯追求规模转向深耕价值,促使行业进入新的理性增长周期。
曾经,大模型领域的“价格屠夫”DeepSeek以其惊人的低价策略,在国内市场掀起了一场旨在将智能“普惠化”的API价格战。彼时,其输入输出价格低至_每百万tokens数元_,甚至带动了智谱、字节、阿里、百度等一众巨头纷纷跟进,降幅一度高达80%-97%,部分轻量级模型更是直接“免费开放”,将这场竞赛推向白热化1。然而,时针拨至2025年,市场风向却悄然转变。DeepSeek自身宣布上调价格,其API最低价格上升了50%。更令人侧目的是,对17家主流厂商的最新定价调查显示,竟有超过七成的企业选择了涨价或停止降价,这无疑是对“智能将如空气般免费”这一论断的一次现实主义修正。
成本驱动:从“无限流量”到“算力赤字”
这场价格回潮并非空穴来风,其背后是令人沮丧的“算力赤字”和不断膨胀的运营成本。尽管GPU租赁价格,如H100,在主流公有云上已趋于稳定,从2024年9月的每卡时5-11美元下降至2025年的2-3美元区间,但新一代大模型无论在训练还是推理阶段,对算力的需求都呈现出几何级增长。这意味着,即使单位算力成本平稳,总体算力支出仍如无底洞般吞噬着厂商的现金流,成为AI服务价格继续下探的“硬门槛”1。
更甚者,数据和人才这两大“燃料”的成本也在水涨船高。昔日免费爬取网络的“野蛮生长”时期已一去不复返。随着监管的趋严和知识产权保护的强化,数据授权费用已成为大模型厂商避无可避的巨额开支。OpenAI与新闻集团(News Corp)达成的_五年期数据使用协议_金额可能高达2.5亿美元,而谷歌与Reddit的协议每年亦价值6000万美元1。与此同时,全球范围内的AI人才争夺战愈演愈烈,推动了工程师薪资的螺旋式上升。在中国,AI技术人员的平均年薪已达32.35万元,其中31.03%的岗位年薪超过50万元。在大洋彼岸的硅谷,机器学习/AI工程师的薪资中位数更是比普通软件工程师高出约13%1。当“数字黄金”与“人肉智能”的身价齐飞,大模型供应商们自然要重新审视其“普惠”的承诺。
策略分化:从规模效应到价值深耕
面对高昂的投入,大模型厂商们正从两个方向寻找出路:一是内部挖潜,优化成本结构;二是外部调整,重塑商业模式。DeepSeek在其V3.1模型中引入“思维链压缩训练”,旨在减少20%-50%的输出token数,同时还支持思考与非思考模式切换,以期节省API成本1。腾讯混元大模型则通过架构创新,融合Transformer和Mamba,寻求性能与效率的平衡1。而OpenAI在GPT-5上采取的“模型自动路由”策略,将简单任务分配给轻量模型处理,据说最高可将推理成本削减60%1。这些技术层面的努力,无一不在印证着那句老话:“开源节流,方为长久之道。”
在商业模式层面,市场策略也呈现出微妙的分化。国际巨头如OpenAI、Anthropic、谷歌和xAI纷纷推出或提高了其高端订阅服务的价格,月费普遍超过200美元,xAI的Grok甚至达到了300美元/月。这些昂贵的“会员卡”背后,是顶尖模型性能的专属通道,将更强的推理能力、更长的上下文窗口等高级功能锁定在高付费用户手中,将_“智能溢价”_发挥得淋漓尽致1。这与OpenAI创始人Sam Altman和谷歌CEO Sundar Pichai早先关于“智能价格将低到无法计量”的乐观预期形成了鲜明对比,更像是对用户进行了一场“先予后取”的市场教育。
在国内,除了少数仍在调整价格以争夺市场份额的厂商(如腾讯混元TurboS价格降至输入0.8元/百万tokens,输出2元/百万tokens)1,更多玩家转向了阶梯定价和模式细分。字节跳动的豆包1.6模型,在输出超过200个token时,价格便从2元/百万tokens跃升至8元/百万tokens1。阿里巴巴的Qwen-Plus则根据输入量和是否为“思考模式”来细化定价,最高输出价格可达64元/百万tokens1。这种精细化运营,旨在从不同用户场景中榨取更多价值,而非一味地追求低价。
有趣的是,DeepSeek V3.1的横空出世,其编程能力甚至超越了Claude 4 Opus,而完成一项编程任务的成本却比后者便宜了68倍2。这使得开源模型对闭源巨头构成了真正的挑战。金沙江创投合伙人朱啸虎曾直言:“若开源模型性能接近闭源模型,后者将失去存在价值。”2 在这种冲击下,即便曾高调推广的月之暗面,也据报大幅收缩了产品投放预算2。显然,曾经烧钱抢用户的逻辑正被残酷的市场现实所修正。
智能的未来:价值重估与可持续发展
大模型价格的阶段性停滞或回升,虽然令部分期望“免费智能”的用户感到失望,但从产业发展的宏观视角来看,这或许是一段必要的“喘息期”。它为厂商提供了回收前期巨额研发和基础设施投入的机会,从而维持可持续的创新能力1。这更像是一场对AI商业模式的成人礼,强迫所有参与者从狂热的技术军备竞赛中清醒过来,开始认真思考如何将千亿美元级别的投资真正转化为商业价值1。
未来,大模型的价格走向仍存在多元路径。一方面,随着模型平均性能的提升和技术优化,具备特定任务处理能力的_“精简版”_中低端模型有望以更低廉的价格进入市场。另一方面,芯片和模型领域的基础研究若能取得突破性进展,或许能在不牺牲效果的前提下,进一步压缩训练与推理的单位成本1。
然而,问题的核心已不再是单纯的技术进步。Anthropic的Claude Code编程Agent因用户“无限调用”导致每月服务成本高达数万美元而被迫取消“无限调用权限”的案例,生动地揭示了订阅模式面临的成本考验1。这不仅仅是技术效率的问题,更是商业价值锚定的挑战。当“智能”不再廉价,真正的竞争将聚焦于谁能提供真正解决痛点、创造商业回报的AI服务,谁能构建起稳固的“护城河”,包括高质量的私有数据、对特定行业工作流的深刻理解以及强大的企业销售渠道2。这场价格回潮,与其说是AI泡沫的破裂,不如说是行业向更成熟、更健康的商业生态迈进的序章。毕竟,即使是新时代的“石油”,也需要炼油厂的精炼和合理的定价,才能真正流淌出黄金。