AI Agent:巨头混战的战略支点,抑或泡沫化的新征程?

温故智新AIGC实验室

2024年,AI Agent浪潮席卷全球,巨头纷纷重金押注,将其视为大模型商业化落地的“新通道”。然而,在资本涌动和演示繁荣的表象之下,Agent技术距离真正的通用智能体仍有显著差距,其本质究竟是“高级自动化”的迭代,还是通往未来AI生态的关键跳板,仍是业界深思的核心命题。

2024年被许多业内人士称为“Agent元年”,这并非偶然。随着通用大模型能力趋同,“百模大战”的价格竞争日益激烈,业界对AI大规模落地的渴望愈发强烈。在这样的背景下,AI Agent作为一种任务导向、自主规划、能够执行多步骤行动的新范式,迅速成为科技巨头与资本竞相追逐的焦点。据来觅 PEVC 数据,自2024年以来,全球AI Agent赛道融资金额已突破665亿元人民币,人形机器人、自动驾驶、大模型等领域尤其受到青睐1

Agent何以成为巨头必争之地?

Agent的兴起,无疑是“后提示词时代”的自然演进。在过去,用户需要耗费大量精力通过精巧的提示词(prompts)与模型反复互动,才能引导其完成任务。而Agent的出现,承诺将这种交互模式从“你问我答”的工具形态,升级为“交付结果”的服务形态。它能够接收给定目标,自主拆解任务,规划执行路径,并调用外部工具或API来完成复杂的工作流程。这更符合人们对“AI助理”的直觉期待,极大地降低了用户与大模型交互的门槛,直接切中了“大模型虽强,但不会用”的行业痛点1

以初创公司Manus为例,其演示视频之所以引人关注,在于它采用了_多智能体系统架构_,能够动态协调不同领域的专用大模型,从而实现超越单一模型能力的“1+1>2”效果。这就像一个交响乐团的指挥,协调各个乐器组共同演奏,不仅克服了单一模型在能力上的局限性,还显著提升了任务处理的效率和复杂性。这种“端到端执行任务”的理念,激发了国内大量创业项目的涌现,他们或基于LangChain、AutoGen等开源框架,或自建执行链路与插件体系,以期更好地匹配本土化场景和用户体验。

对科技巨头而言,Agent不仅是一道必须作答的考题,更是一条开辟新应用、解锁存量业务变现潜力的新通道。它将大模型能力从技术底层提升到应用界面,重塑了人机交互的体验,并提供了一个颗粒度更小、试错成本更低、商业价值验证更快的落地路径。从根本上说,Agent的爆发,是多重因素交汇的结果:大模型能力的飞跃提供了坚实的技术底座;用户对更高效、更直观AI交互的强烈需求促使其演进;而巨头在“百模大战”后寻求差异化和商业化突破的战略压力,则加速了其投入和布局1

繁荣下的AB面:技术突破还是“高级自动化”?

然而,在Agent概念的繁荣背后,质疑之声从未间断。许多华丽的演示往往忽略了复杂的场景条件和大量的人工干预。一个Agent能够“自助手写文章”或“自动化办公”,通常依赖于精心编写的提示词、稳定可靠的网络资源和预设的API接口。但在实际部署中,Agent需要应对环境不稳定、异常处理、及时纠错等一系列挑战,这些都远非现有技术能够完美解决1

不少技术人士指出,当前绝大多数Agent产品距离真正的“智能体”仍有不小的差距。尽管它们在路径规划、工具调用和多轮交互方面比传统对话系统有所进步,但其核心逻辑仍停留在“任务自动化”的增强版。换言之,许多所谓的Agent,更像是披着AI外衣的_“流程机器人”_,其真实效率提升往往有限,需要用户持续的“监督+修正”1

从技术底座来看,Agent的稳定运行强依赖于几个尚未完全成熟的关键环节:

  • 环境建模与感知:对动态、复杂真实世界的理解和适应能力不足。
  • 记忆与上下文管理:难以在长时间、多步骤任务中保持一致性和连贯性。
  • 长期目标拆解与泛化:复杂任务的自主拆解能力有限,跨领域泛化能力较弱。
  • 多模态融合与工具链稳定性:对多模态信息的处理和外部工具的稳定调用仍面临挑战1

更重要的是,从用户体验的角度来看,Agent带来的改变常常不如预想中那般“革命性”。用户仍然需要学习如何“正确地”提示Agent才能获得理想结果,不少产品陷入“体验上像是套壳Siri,底层上是复杂Prompt拼贴”的窘境。一些早期评估也揭示了这一问题。例如,Y Combinator的AI Startup School就曾指出,在AI Agent创业热潮下,90%的项目因落地执行问题而无法跑通,这表明实用性与市场接受度比模型能力本身更为关键2

面对这些挑战,创业公司和巨头采取了不同的策略。以Manus为代表的初创企业倾向于前沿探索,追求功能极限,开放早期用户测试,但其稳定性与实际可用性常被质疑。而字节、百度等大厂则采取更稳健的路径,将Agent功能逐步融入现有产品,以部件化、插件化的形式提供服务,并强调闭环业务、安全控制以及在落地前的可控性与行业适应度1

巨头混战:战略卡位与差异化求生

尽管面对技术短板,各大巨头在Agent赛道上的投入却有增无减,这反映了它们以Agent为抓手,重塑人与产品、人与服务、人与平台之间关系的共同意图。

字节跳动在Agent领域的布局以_内容驱动与生态构建_为核心。早在2023年底,字节就推出了豆包智能体平台,强调“人人都能造Agent”,随后在2024年初发布的“扣子”(Coze)平台进一步降低了智能体开发门槛,通过可视化流程、拖拽组件和内置插件,让非技术背景的用户也能创建功能丰富的智能体,并一键发布至豆包、飞书、抖音等多个渠道1。扣子本质上是一个智能体应用广场,整合了插件系统、工作流引擎和知识库接入,截至2025年第一季度,豆包平台上已上线智能体超过10万个,体现出其在推动生态建设和吸引开发者方面的先发优势1

腾讯的Agent战略则体现了_“平台+能力”_的思路。自2024年底起,Agent被正式纳入腾讯云的大模型战略,形成面向C端用户与轻量开发者的“元器”和面向企业级需求的“腾讯云智能体开发平台”双平台体系。腾讯正通过Qbot浏览器等产品拓展Agent的行为边界,使其具备文件转换、应用操作等能力,并有望与本地软件打通,成为用户常驻的多功能助手。在企业服务层面,腾讯强调Agent对高复杂度、高知识密度行业的改造潜力,已在汽车、金融、零售等多个行业展开场景合作1

阿里巴巴在Agent方向的思考,延续了其_深耕企业服务_的路径。自2023年起,钉钉就开始试点智能助理功能,并在2024年升级为“AI助理中心”,2025年开放智能体开发框架,支持企业定制数字员工。阿里的核心优势在于紧贴企业实际需求,强调数据私有、安全可信和系统兼容。其通义千问Qwen系列大模型为Agent应用提供了强大基础能力,并开源Qwen-Agent框架,降低开发门槛。此外,夸克App推出“智能体中枢”,阿里发布“心流”智能体应用,并在外贸、智能客服等领域推出多样化Agent产品1

百度作为最早布局大模型的公司之一,在Agent方向的探索则以_产品闭环和底层模型为基石_。在Create 2025百度AI开发者大会上,百度推出了“心响”APP,定位为一款以“AI任务完成引擎”为核心的通用超级智能体APP,已覆盖200多个任务类型,未来计划扩展至10万种以上。同时,百度的文心智能体平台为零代码基础用户提供全链路创作服务,并全面拥抱MCP(Multi-Agent Collaboration Protocol)协议,应用于文心大模型、千帆平台及核心产品,以提升Agent在任务规划和调度中的精确度与效率,并推动其生态发展1

总体而言,Agent并非一个孤立的技术标签,而是模型能力、应用框架与用户需求三者交汇的产物。巨头在Agent上的布局,反映出它们各自的生态定位与资源禀赋。字节强调内容与生态,腾讯侧重能力组件与业务整合,阿里深耕产业落地与定制化,百度则以产品闭环和底层模型为支撑。这场Agent竞速,更像是大模型商业化的一场阶段性演进,而非明确的终点1

泡沫的消解与未来的真实

Agent无疑具备塑造未来产品形态的巨大潜力,它融合了深度模型能力、直观交互逻辑与精巧任务调度,将AI从被动“回答者”推向主动“行动者”。然而,通往未来的道路充满坎坷,每一个技术热点都难免经历“高估—失望—再估值”的泡沫周期1

当前的Agent热潮,既是技术突破的阶段性成果,也裹挟着巨头对增长焦虑的投射。资本、流量和研发资源的倾斜,使其呈现出“预期大于现实”的膨胀状态。那些缺乏稳定场景支撑、难以形成用户复购的Agent应用,很可能会在下一轮融资窗口关闭时迅速退潮。正如一些评论所言,许多Agent的“聪明感”背后,调度逻辑可能与“AI”关联甚微,几乎只是流水线式脚本执行1

但这并不意味着泡沫本身是负面的。技术演进从不可能一帆风顺,泡沫本身就是一种筛选机制,更是一种催化剂。真正的问题在于:谁能在热潮退却后,留下可复用的底层架构与产品模型?谁能真正找到场景契合、用户愿意长期使用的价值点,并将其转化为可持续的商业模式?

Agent不会是终点,它更像是一块通向下一阶段AI生态的跳板。它促使行业重新思考AI的真正价值所在:不是单纯的技术炫技,而是能否在现实世界中解决实际问题,创造真实价值。因此,问题不在于它“是不是泡沫”,而在于谁能在泡沫散去之后,站稳脚跟,继续前行,将愿景转化为可触及的现实1

引用


  1. 巨头混战Agent,押注背后是真未来还是新泡沫?·AI大模型工场·西梅汁(2025/7/1)·检索日期2025/7/1 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. AI Agent 大爆发背后,YC发现了90% 都跑不通的真问题·53AI(2025/6/28)·检索日期2025/7/1 ↩︎