TL;DR:
AI Agent赛道正经历一场残酷洗牌,通用Agent因缺乏杀手级场景和高昂成本,被日益强大的大模型和精准的垂类Agent双向挤压。然而,技术突破,特别是强化学习(RL)的应用,正为其注入新的自主学习能力,预示着从工具调用者向真正智能体的深层进化。
金沙江创投主管合伙人朱啸虎一句“90%的Agent会被大模型吃掉”的惊人论断,如同平地一声惊雷,震动了AI Agent这个在过去一年中炙手可热的赛道1。在被誉为“Agent之年”的2024年,通用Agent的明星公司Manus却传出总部迁至新加坡、国内大规模裁员并放弃国内版本上线的消息,这不仅是Manus的个案,更折射出当前通用Agent市场面临的深层困境与结构性挑战。
当前产业格局分析:通用Agent的“双向挤压”困境
通用AI Agent,曾被寄予厚望,被视为连接大模型与实际应用场景的关键桥梁。然而,在市场的检验下,它们正陷入前所未有的“双向挤压”:
- 大模型能力的“溢出效应”: 随着Claude、Gemini等基础大模型迭代升级,其自身的编码、推理和长文本处理能力显著增强,模型本身正变得越来越“Agent化”。用户可以直接调用这些功能强大的基础模型API或对话界面,以更低廉的成本和更便捷的方式完成任务,无需依赖独立的通用Agent产品。例如,Opus 4每月200美元即可不限量使用,而Manus最高档Pro会员在价格接近的情况下,仍受限于积分制,导致单位任务成本更高,限制了使用频率2。这导致通用Agent的市场份额被基础模型直接“蚕食”。
- 垂类Agent的精准打击: 在企业级应用中,通用Agent的通用性反而成为劣势。企业对准确性、稳定性及与内部系统深度集成有极高要求。垂类Agent,如金沙江投资的Head AI(专注于自动化营销),通过连接企业内部知识库、业务流程系统,能够提供更精准、更高效的解决方案。通用Agent因其“黑盒”特性和潜在的“幻觉”问题,难以满足企业对决策透明度和结果稳定性的需求,导致其在企业端应用效果不佳,无法达到“数字员工”的高度3。
这种“夹心饼干”式的生存空间,使得Manus、Genspark等C端通用Agent产品在经历短暂的流量和收入高峰后,出现了访问量和月度收入的明显下滑。数据显示,Manus和Genspark在6月的月度收入分别环比下跌超过50%和13.58%4,印证了市场对通用Agent的短期热度并未转化为持续的付费忠诚度。
变革驱动力解读:从“工具调用器”到“自主智能体”的进化
通用Agent目前的核心问题是未能找到能让用户持续付费的“杀手级应用场景”。当前多数通用Agent集中在制作PPT、多模态能力和撰写报告等办公场景,但其输出的质量和价值普遍不高,常出现事实错误、信息冗余或缺乏增量信息等问题。这暴露了当前Agent能力的局限性:它们更像是工具的“编排器”或“调用器”,而非真正具备自主决策和复杂任务执行能力的智能体。
然而,AI Agent的未来并非黯淡无光,关键在于技术突破。当前,业界正将目光投向以下核心技术方向,以期打破现有瓶颈:
- 长上下文窗口与线性注意力机制: 复杂任务的执行往往需要Agent处理海量的上下文信息。传统模型受限于上下文窗口大小,容易在长任务中丢失早期关键信息,导致决策失误5。MiniMax通过将线性注意力机制应用到新模型M1中,大幅扩展了智能体能够承载的文本量至100万tokens,这对于法律文书分析等需要大量文本理解的场景至关重要。
- 强化学习(RL)的深层赋能: 众多业内人士强调,RL是提升Agent能力上限的关键。与传统的监督学习或预训练模型不同,RL允许Agent通过与环境的大量试错和奖励机制来提升泛化能力和自主性。在处理需要多个步骤协同的复杂任务时,RL能够让Agent更好地适应动态变化的环境,并从失败中学习,优化决策流程,从而提高任务执行的稳定性和准确性6。
- 月之暗面(Moonshot AI)强调“模型即Agent”,其基座模型即基于端到端自主强化学习技术训练。
- Kimi-Researcher研究员冯一尘指出,Agent模型在Humanity's Last Exam(HLE)测试中的得分从8.6%跃升至26.9%,印证了RL在Agent训练上的巨大价值。
- OpenAI最新发布的ChatGPT Agent在HLE测试中取得了41.6%的新SOTA成绩,再次彰显了强化学习对于通用Agent性能的里程碑式提升7。
强化学习的引入,预示着Agent将从简单的“工具调用器”向具备“自主学习”和“环境适应”能力的“自主智能体”进化。 这不仅是技术层面的演进,更是AI与人类交互模式的深层变革,意味着Agent将能够更主动、更智能地完成任务,甚至在复杂、不确定的环境中做出接近人类的决策。
未来竞争态势预测:平台化、垂直化与“真智能”Agent的崛起
展望未来3-5年,AI Agent的市场竞争格局将呈现出以下特点:
- 大厂的“平台+生态”战略: 拥有自研大模型和云基础设施的科技巨头,将继续采取“两手抓”模式:一方面开发自家Agent产品作为能力展示窗口,另一方面更侧重于推广Agent开发平台,通过提供API、SDK、算力支持及组织开发者竞赛等方式,吸引开发者构建垂类Agent生态。这使得通用Agent的开发成为“小厂玩不起的生意”,市场将进一步向少数具备强大基础模型和生态构建能力的企业集中。
- 垂类Agent的深耕与爆发: 面向特定行业和场景的垂类Agent将迎来真正的爆发期。它们通过深度集成行业知识库和业务流程,解决具体痛点,提供超越通用Agent的精准度和效率。无论是企业级营销、法务、金融分析,还是个人端的教育、健康管理等,垂直领域的深耕将是Agent实现商业化价值的关键路径。
- “真智能”Agent的迭代与普及: 随着强化学习、长上下文窗口、多模态融合等技术的不断成熟,未来将涌现出少数能够真正实现复杂任务自主执行、信息价值高、且具备一定通用泛化能力的“真智能”Agent。这些Agent将不再是简单的信息整合或工具调用,而是能够主动规划、迭代优化、甚至创造性解决问题的助手。它们将重新定义人机协作的边界,使得AI真正成为人类的“协同智能”。
从商业角度看,当前通用Agent面临的变现困境并非能力不足的终结,而是市场在寻求真实需求和商业模式的必然过程。最初的流量红利和高额ARR(年化收入)证明了市场对Agent概念的认可,但MRR(月度收入)的下滑则警示了产品与实际用户需求的脱节。未来的商业化将更加依赖于Agent所能创造的增量价值,而非仅仅是现有流程的自动化。这意味着:
成本效益、准确性、场景适配度将成为决定Agent商业成功的关键指标。
社会影响与伦理思考:数字劳动力的重塑与人类价值的再定义
Agent的进化,尤其是其自主性和适应性的增强,将对社会结构和工作方式产生深远影响。具备自主学习和复杂任务处理能力的Agent,将进一步模糊“数字劳动力”与“人类劳动力”的界限。
- 工作模式变革: 基础性、重复性的工作将被Agent大规模替代,而人类将更多地从事需要创造力、批判性思维、情感智能和复杂协调的任务。企业将加速数字化转型,将Agent深度融入业务流程,构建高效的“人机协作”新型组织。
- 技能需求重塑: 对人类而言,适应与Agent协作、管理Agent、开发Agent将成为新的核心技能。教育体系需要更快速地响应这一变化,培养具备AI素养和跨学科能力的人才。
- 伦理挑战: 随着Agent自主性的提升,其决策的透明度、责任归属、数据隐私以及潜在的偏见等伦理问题将变得更加突出。如何建立有效的治理框架,确保Agent的发展符合人类的价值观和利益,是摆在监管机构、企业和社会面前的重大挑战。Agent的“幻觉”问题若未得到有效控制,可能引发严重的社会信任危机。
总而言之,AI Agent的故事才刚刚开始。它正从一个概念走向实践,从最初的浮躁热潮回归技术深耕与场景验证。朱啸虎的“90%被吃掉”的论断,与其说是悲观预测,不如说是对早期泡沫的警示,以及对真正有价值、能落地产品的呼唤。未来的Agent,必然是深度融合强化学习等前沿技术,能够精准匹配特定场景,并最终成为重塑人类生产生活方式的强大力量。这不仅是技术的突破,更是对“智能”本质的一次深刻探索,以及对人类文明进程的又一次重大变革。
引用
-
大模型会吃掉90% 的Agent,如何评价朱啸虎的这一观点?·知乎·(2025/7/15)·检索日期2025/7/18 ↩︎
-
90%被大模型吃掉,AI Agent的困局·光锥智能·魏琳华(2025/7/18)·检索日期2025/7/18 ↩︎
-
朱啸虎断言:AI 大模型会吃掉九成Agent 市场·IT之家·(2025/7/16)·检索日期2025/7/18 ↩︎
-
90%被大模型吃掉,AI Agent的困局·光锥智能·魏琳华(2025/7/18)·检索日期2025/7/18 ↩︎
-
我们距离Agent的DeepSeek时刻还有多远(AI Agent 系列二)·AI TNT·(2025/7/18)·检索日期2025/7/18 ↩︎
-
AI芯天下丨深度丨2025年上半年开启“万物皆可Agent”浪潮·维科号·(2025/7/18)·检索日期2025/7/18 ↩︎
-
90%被大模型吃掉,AI Agent的困局·光锥智能·魏琳华(2025/7/18)·检索日期2025/7/18 ↩︎