万亿Token揭示AI大分流:开源逆袭、智能体崛起与全球化新版图

温故智新AIGC实验室

TL;DR:

2025年,AI产业正经历一场由100万亿Token真实数据揭示的“大分流”。开源模型流量占比达30%,中国力量崛起显著;AI从单纯生成文本转向多步推理的智能体模式;市场高度细分,编程与角色扮演是两大主导应用;用户留存的关键在于“首发即匹配”特定痛点。

2025年,人工智能领域正经历一场前所未有的“大分流”,其本质超越了单纯的技术竞赛,而是演变为一场关于场景适配、成本控制与生态构建的综合博弈。OpenRouter与a16z联合发布的一份基于全球超过100万亿Token真实交互数据的深度报告,为我们提供了窥探这一复杂演进的“上帝视角”,揭示了诸多反直觉的趋势,预示着AI技术与商业模式的深层重构。12

当前产业格局分析:多极共存与价值重塑

这份里程碑式的报告,基于300多个模型和60多个提供方的海量数据,勾勒出2025年AI生态的全新面貌:

开源力量的强势崛起与中国AI的加速登场。 传统观念认为开源模型是闭源的“平替”,但数据表明,开源模型流量占比已稳步提升至30%,并大量进入生产环境,成为特定场景下的首选。值得注意的是,中国开源模型异军突起,从2024年末的1.2%份额飙升至2025年下半年的近30%,以DeepSeek、Qwen、Kimi、GLM为代表的模型凭借惊人的迭代速度和对特定场景的统治力,打破了开源市场“一家独大”的局面,形成“群雄割据”之势。13 这标志着中国AI已杀入全球开源赛道第一梯队,成为重要的模型生产者。

“中杯”模型异军突起,重新定义效率与能力平衡。 过去,市场倾向于走向小模型(<15B)与大模型(>70B)的两极。然而,2025年“中型模型”(15B-70B)正在成为新的主力。以Qwen 2.5 Coder 32B和Mistral Small 3为代表的中型模型,在能力与效率之间找到了完美平衡,精准满足了用户对性价比与性能兼顾的需求,成为市场主流。3

AI应用场景的两极分化:生产力与创造力的双引擎。 报告通过对数十亿次请求的分类分析发现,AI的实际应用场景呈现出惊人的集中性:编程任务(占总流量50%+)统治着生产力领域,而角色扮演(占开源流量52%)则在创造力与娱乐领域占据主导地位。1 Anthropic的Claude系列在编程领域拥有统治级地位,而DeepSeek等中国模型则在角色扮演和闲聊方面表现出极高粘性。这种现象打破了“AI主要是生产力工具”的刻板印象,揭示了人类对AI在功能性工具和情感性伙伴双重需求上的强烈渴望。

全球化加速:亚洲成为AI增长新引擎。 AI不再是硅谷的独角戏。亚洲地区的付费使用量占比从13%翻倍至31%,成为全球AI应用的关键增长极。在语言分布上,英语虽仍主导,但简体中文以近**5%**的份额位居第二,超越西班牙语和俄语,印证了中国市场的庞大需求和AI社区的活力。12

变革驱动力解读:智能体崛起与用户价值重构

这些格局变化并非偶然,而是由深层次的技术进步和用户行为演变共同驱动:

智能体推理的崛起:AI从“生成”到“思考”的范式转变。 如果说2024年是“聊天机器人”的年份,那么2025年则是“智能体”的年份。推理优化模型的流量占比已飙升至50%以上,标志着AI的使用方式从简单的文本生成转向了复杂的多步任务执行。用户不再满足于模型“吐出”文本,而是要求其进行内部的思维链(CoT)计算、规划和反思,甚至通过“工具调用”(tool use)与外部系统交互。14 xAI的Grok Code Fast 1和Google的Gemini 2.5系列在这一领域领跑,推动了平均Prompt长度暴涨四倍、Output长度翻倍,反映出工作负载对上下文依赖度和复杂度的显著提升。

“灰姑娘的水晶鞋”效应:用户留存的核心逻辑。 在模型迭代加速的时代,传统的留存概念被“灰姑娘的水晶鞋”效应所取代。当新模型发布时,若能率先完美解决市场中未被满足的特定高难度工作负载,它将迅速捕获一批“基石用户群”。这些用户会围绕该模型构建基础设施和工作流,形成极高的迁移成本和粘性,即便后续有更便宜或表面上更强的模型出现,也难以轻易流失。GPT-4o Mini、Claude 4 Sonnet和Gemini 2.5 Pro的成功留存曲线验证了这一理论。134

价格弹性弱化与“杰文斯悖论”:重塑AI商业模式。 报告发现,整体降价10%仅带来不足1%的使用量增长,这表明对于高价值、高风险、对质量要求严格的任务,用户对价格并不敏感。然而,在特定高效模型上,极致低价却可能引发“杰文斯悖论”,即当技术变得足够便宜和好用时,人们会在更多地方、用更长上下文、更频繁地调用它,导致总Token量飙升,总支出不降反升。14 这揭示了AI市场在成本与使用量之间复杂的非线性关系,驱动了“溢价工作负载”、“大众流量驱动”、“专业专家”和“利基工具”四大市场象限的形成。

未来竞争态势预测:场景适配与生态协作的时代

基于这些洞察,我们可以预测未来3-5年的AI竞争将呈现以下趋势:

多模型生态成为常态,专业化分工愈发清晰。 “五六个开源模型,各自都有稳定流量”的局面预示着“赢家通吃”的时代已远去。闭源模型将继续专注于高价值、高风险和需要极高稳定性的企业级应用,而开源模型则在成本敏感、大容量、对完美度要求略低的场景中占据主导。开发者将根据任务特性,灵活选择和组合模型,形成更为精细的多模型策略。1

智能体能力将成为核心竞争要素。 AI模型的优劣,将不再局限于“单次回答漂不漂亮”,而是其在长链路中“执行持续推理”的可靠性和效率。未来,模型厂商的重心将转向提升模型的工具调用能力、长上下文处理能力以及多步任务规划能力,以更好地服务于复杂的工作流和自主智能体。

“水晶鞋效应”将重塑产品与市场战略。 对AI模型厂商而言,率先识别并完美匹配未被满足的、高价值的工作负载,将是构建核心护城河的关键。这意味着产品开发将更加聚焦于特定痛点而非泛化能力,市场推广也将侧重于早期用户的深度锁定和工作流集成。持续的迭代和对细分场景的深刻理解,将比单纯的性能跑分更能带来持久的商业价值。

全球创新与地缘竞争并存。 亚洲,特别是中国,将继续在全球AI创新版图中扮演更重要的角色。多语言、多文化适配将成为模型普适性的刚需能力。同时,全球AI力量的均衡发展也将加剧地缘政治与技术竞争的复杂性,数据主权、模型安全与AI治理将成为国际合作与博弈的焦点。

社会影响与伦理思考:技术与人性的交织

AI的“大分流”不仅是技术和商业的变革,也深刻触及了社会结构和人类生活。编程AI的大规模应用将加速软件工程领域的自动化,改变开发者的工作模式,提升生产力。而角色扮演AI的兴盛,则揭示了人们对情感陪伴、互动娱乐和个性化故事创作的深层需求。这可能带来新的娱乐形式和心理慰藉,但同时也引发关于人机关系、内容审查(尤其在开源领域)和数字身份认同的伦理思考。AI在作为高效生产力工具的同时,也正成为人类情感与创造力的重要延伸,这种双重属性将持续定义我们与智能体共存的未来。


引用


  1. 100万亿Token看懵硅谷!全球一半算力写代码,另一半在「搞颜色」·知乎·新智元(2025/12/06)·检索日期2025/12/8 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. 100万亿Token看懵硅谷!全球一半算力写代码·腾讯新闻·新智元(2025/12/06)·检索日期2025/12/8 ↩︎ ↩︎

  3. 开源模型从“一家独大”到“群雄割据”,中国AI杀入第一梯队|token - 网易·网易·华尔街见闻官方(2025/12/05)·检索日期2025/12/8 ↩︎ ↩︎ ↩︎

  4. 人们用AI在做什么?答案藏在100万亿token背后 - 网易·网易·无(2025/12/05)·检索日期2025/12/8 ↩︎ ↩︎ ↩︎