重磅！OpenAI Agent模式「 Manus Style」上线：AI不光会聊，还要替你「跑腿」了！

TL;DR：

AI不光动嘴皮子，现在真要「动手」了！OpenAI刚刚甩出Agent模式王炸，让ChatGPT能在虚拟环境里帮你网购、做PPT甚至订机票，效率直接「起飞」。不过这活儿跟之前爆火的Manus模式有点像，是巧合还是英雄所见略同？反正，一个AI帮你干活、你只负责「拍板」的新时代，真的来了！

一场发布会，直接把AI圈子搅得「沸腾」！前几天，OpenAI突然官宣了自家重磅新活儿——Agent模式。这玩意儿一出，直接把AI从「Chat时代」的动嘴皮子，带进了「Agent时代」的「动手实操」环节。说白了，就是AI不光能跟你侃大山、写代码，现在还能亲自上阵，帮你把事儿给办了！

不过，眼尖的网友们发现，这OpenAI的Agent模式，怎么看怎么有点眼熟，活脱脱就是几个月前刷爆全网的「Manus」模式的OpenAI官方加强版啊！这不禁让人好奇：是「英雄所见略同」的巧合，还是OpenAI在憋大招，憋出了一个「Manus Plus」？

「动手」时代已来：这AI不光会说，还会跑腿了！

想象一下这个场景：你只需要跟ChatGPT说一声「婚礼缺双鞋，去电商平台帮我买了」，或者「给我设计个宠物周边，直接下单打印」，甚至「查个资料，直接生成PPT」。然后呢？然后就没有然后了！ChatGPT会自己打开一个「虚拟电脑」，就像你我在电脑前操作一样，一步步地把这些琐事儿全搞定！¹

在OpenAI演示的Demo里，一个复杂任务大概10分钟就能「丝滑」完成。这效率，简直是打工人的「梦中情A」啊！它能在虚拟环境里自由切换文本浏览器（专门啃文字找信息），可视化浏览器（模拟你的鼠标点击，看图，交互），以及终端（运行代码、调API、生成各种文件，甚至连接你的云服务）。这三大「生产力工具人」一组合，基本涵盖了你日常工作的方方面面。

比如第一个Demo，简直是「人间真实」：研究员要规划朋友婚礼，又是挑礼服，又是订酒店，还得给礼物建议。把需求一抛给Agent，它立马启动「虚拟电脑」，先用文本浏览器啃婚礼网站，找着装要求、天气信息。发现日期不明，还知道问你！确认信息后，它就开始推荐礼服，切换到可视化浏览器看效果。最后，一份长达N页，链接、截图、酒店空位索引一应俱全的「婚礼出行报告」新鲜出炉！整个过程，只花了十分钟。搁你，不得累趴？²

再比如给团队吉祥物（一只名叫Bernie的可爱狗狗）定制贴纸，并且直接下单500张！Agent直接用终端调出图像生成工具，几秒钟搞定设计图。接着，它自己打开Sticker Mule网站（一个定制贴纸的网站），把图上传，填数量、尺寸，然后……加入购物车！最后还贴心地问你：「这张图可以吗？要继续下单吗？信用卡信息你输还是我继续？」——简直是把「保姆级服务」发挥到了极致！³

除了这些，Agent还能自己连上Google Drive API，读取文件生成PPT；甚至帮你查询赛季日程，搞出包含详细旅行电子表格和标注地图的攻略。这活儿虽然花了25分钟，但想想自己要跑多少个网站、点多少个链接、整理多少份文档，是不是瞬间觉得「真香」了？

幕后揭秘：OpenAI的「骚操作」与「凡尔赛」

OpenAI这次端出来的Agent模式，其实不是凭空变出来的「黑科技」。它是个「集大成者」，是由OpenAI上半年推出的两个工具——Operator和Deep Research——融合而成的「究极体」！⁴

Operator：原本是Pro用户专属的「浏览器Agent」，擅长在图形界面上「点点点」，完成操作。
Deep Research：则是个「学霸型选手」，能海量阅读网页，产出深度报告。

OpenAI发现，很多用户用Operator提示词，其实是想干Deep Research的活儿（比如「计划一次旅行」）；而Deep Research用户又渴望能让AI「登录网站、访问受保护资源」（这不就是Operator的拿手活吗？）。于是，团队一拍大腿，干脆「合体」！结果，两个原本有点「各自为营」的项目，竟然产生了「奇妙的化学反应」，避开了单一工具的低效，让AI的「办事效率」瞬间飙升。

这种「想做就做」的工程师文化，也侧面印证了此前OpenAI离职工程师的爆料。看来，在OpenAI内部，只要是好点子，大家都能「撸起袖子加油干」！

那AI是怎么学会「精打细算」、在什么场景用什么工具的呢？答案是：强化学习！⁵ 刚开始，它就像个「笨小孩」，解决个简单问题都要把所有工具试一遍。但通过不断「奖励」那些效率高、更合理的行为，模型就慢慢「开窍」了，知道啥时候该用文本浏览器，啥时候该切换终端「放大招」！

在演示Demo的同时，OpenAI还不忘「轻描淡写」地丢出了几个「凡尔赛」成绩单：

在「人类的最后一场大考」（Humanities Last Exam）中，带工具的Agent模式模型，居然拿到了42%的高分，比不带工具的模型直接翻了一倍！
更「凡」的是，它还和竞争对手Grok 4 Heavy「隔空」比拼了一下，虽然略逊一筹（Grok 45%），但已是世界领先水平！
在网页操作能力（WebArena）和电子表格操作能力（SpreadsheetBench）上，Agent模式虽然还没超越人类，但在网页操作上已经「追近」人类水平！这意味着，即使只是整合现有工具，大模型的潜力依旧是「深不可测」！

Agent时代，我们是「主人翁」还是「打工人」？

Agent模式的爆发，毫无疑问是2025年AI圈的「绝对风口」。但这股风，吹来的不仅是机遇，还有一连串的「灵魂拷问」。

首先，对于那些靠「Agent模式」起家的第三方开发者和初创公司（比如之前的Manus），OpenAI亲自下场，究竟是「催生一个繁荣生态」还是「直接降维打击」？这道题，恐怕只有时间能给出答案。

其次，也是最让人「头皮发麻」的问题：隐私和安全！ 当AI在你看不到的「虚拟机」里帮你逛淘宝、输信息，甚至直接下单时，谁来保证你的数据安全？万一它不小心「误入歧途」，被钓鱼网站骗走了你的信用卡号，这锅谁来背？OpenAI虽然信誓旦旦地说会采取「极其严格的审查和安全措施」，但Sam Altman也坦言，整个社会都需要时间去适应和建立规范，就像我们当年学会上网，也要学会甄别诈骗信息一样。⁶

Sam Altman说：「这是一个全新的范式。就像我们学会上网，最后也学会了甄别诈骗信息一样，现在，整个社会需要学习如何与Agent安全地交互和共存。」 — 这话听着挺真诚，但咱心里还是有点「慌」啊，毕竟AI的「手」要是伸得太长，可就不是幻觉那么简单了！

最后，也是最直击「打工人」灵魂的问题：我的工作，会被AI抢走吗？ 当AI能独立完成一份包含数据检索、图像查证的复杂报告，并直接在线预订时，那些天天坐在格子间里的白领们，到底是会被AI「赋能加速」，变成「超级人类」，还是被AI「彻底威胁」，变成「无业游民」？

答案，此刻还在风中「摇曳」。

但无论我们是对此「喜大普奔」、还是「瑟瑟发抖」，亦或是「一脸懵圈」，一个由Agent驱动的、更自动化、更「懂事」的新时代，确实正在以我们肉眼可见的速度，加速狂奔而来。你，准备好迎接这个既刺激又充满挑战的「动手」时代了吗？

引用

刚刚，OpenAI 发布了自己的Agent模式，Manus Style·极客公园·Li Yuan（2025/7/18）·检索日期2025/7/18 ↩︎
刚刚，OpenAI 发布了自己的Agent模式，Manus Style·科技-新浪·（2025/7/18）·检索日期2025/7/18 ↩︎
Introducing ChatGPT agent: bridging research and action·OpenAI·（2025/7/18）·检索日期2025/7/18 ↩︎
[PDF] 人工智能专题报告： Operator和Manus打开AI Agent时代·东方财富网·（2025/3/12）·检索日期2025/7/18 ↩︎
Introduction to ChatGPT agent·YouTube·Sam Altman, Casey Chu, Isa Fulford, Yash Kumar, and Zhiqing Sun（2025/7/18）·检索日期2025/7/18 ↩︎
刚刚，OpenAI 发布了自己的Agent模式，Manus Style·极客公园·Li Yuan（2025/7/18）·检索日期2025/7/18 ↩︎