TL;DR:
AI不光动嘴皮子,现在真要「动手」了!OpenAI刚刚甩出Agent模式王炸,让ChatGPT能在虚拟环境里帮你网购、做PPT甚至订机票,效率直接「起飞」。不过这活儿跟之前爆火的Manus模式有点像,是巧合还是英雄所见略同?反正,一个AI帮你干活、你只负责「拍板」的新时代,真的来了!
一场发布会,直接把AI圈子搅得「沸腾」!前几天,OpenAI突然官宣了自家重磅新活儿——Agent模式。这玩意儿一出,直接把AI从「Chat时代」的动嘴皮子,带进了「Agent时代」的「动手实操」环节。说白了,就是AI不光能跟你侃大山、写代码,现在还能亲自上阵,帮你把事儿给办了!
不过,眼尖的网友们发现,这OpenAI的Agent模式,怎么看怎么有点眼熟,活脱脱就是几个月前刷爆全网的「Manus」模式的OpenAI官方加强版啊!这不禁让人好奇:是「英雄所见略同」的巧合,还是OpenAI在憋大招,憋出了一个「Manus Plus」?
「动手」时代已来:这AI不光会说,还会跑腿了!
想象一下这个场景:你只需要跟ChatGPT说一声「婚礼缺双鞋,去电商平台帮我买了」,或者「给我设计个宠物周边,直接下单打印」,甚至「查个资料,直接生成PPT」。然后呢?然后就没有然后了!ChatGPT会自己打开一个「虚拟电脑」,就像你我在电脑前操作一样,一步步地把这些琐事儿全搞定!1
在OpenAI演示的Demo里,一个复杂任务大概10分钟就能「丝滑」完成。这效率,简直是打工人的「梦中情A」啊!它能在虚拟环境里自由切换文本浏览器(专门啃文字找信息),可视化浏览器(模拟你的鼠标点击,看图,交互),以及终端(运行代码、调API、生成各种文件,甚至连接你的云服务)。这三大「生产力工具人」一组合,基本涵盖了你日常工作的方方面面。
比如第一个Demo,简直是「人间真实」:研究员要规划朋友婚礼,又是挑礼服,又是订酒店,还得给礼物建议。把需求一抛给Agent,它立马启动「虚拟电脑」,先用文本浏览器啃婚礼网站,找着装要求、天气信息。发现日期不明,还知道问你!确认信息后,它就开始推荐礼服,切换到可视化浏览器看效果。最后,一份长达N页,链接、截图、酒店空位索引一应俱全的「婚礼出行报告」新鲜出炉!整个过程,只花了十分钟。搁你,不得累趴?2
再比如给团队吉祥物(一只名叫Bernie的可爱狗狗)定制贴纸,并且直接下单500张!Agent直接用终端调出图像生成工具,几秒钟搞定设计图。接着,它自己打开Sticker Mule网站(一个定制贴纸的网站),把图上传,填数量、尺寸,然后……加入购物车!最后还贴心地问你:「这张图可以吗?要继续下单吗?信用卡信息你输还是我继续?」——简直是把「保姆级服务」发挥到了极致!3
除了这些,Agent还能自己连上Google Drive API,读取文件生成PPT;甚至帮你查询赛季日程,搞出包含详细旅行电子表格和标注地图的攻略。这活儿虽然花了25分钟,但想想自己要跑多少个网站、点多少个链接、整理多少份文档,是不是瞬间觉得「真香」了?
幕后揭秘:OpenAI的「骚操作」与「凡尔赛」
OpenAI这次端出来的Agent模式,其实不是凭空变出来的「黑科技」。它是个「集大成者」,是由OpenAI上半年推出的两个工具——Operator和Deep Research——融合而成的「究极体」!4
- Operator:原本是Pro用户专属的「浏览器Agent」,擅长在图形界面上「点点点」,完成操作。
- Deep Research:则是个「学霸型选手」,能海量阅读网页,产出深度报告。
OpenAI发现,很多用户用Operator提示词,其实是想干Deep Research的活儿(比如「计划一次旅行」);而Deep Research用户又渴望能让AI「登录网站、访问受保护资源」(这不就是Operator的拿手活吗?)。于是,团队一拍大腿,干脆「合体」!结果,两个原本有点「各自为营」的项目,竟然产生了「奇妙的化学反应」,避开了单一工具的低效,让AI的「办事效率」瞬间飙升。
这种「想做就做」的工程师文化,也侧面印证了此前OpenAI离职工程师的爆料。看来,在OpenAI内部,只要是好点子,大家都能「撸起袖子加油干」!
那AI是怎么学会「精打细算」、在什么场景用什么工具的呢?答案是:强化学习!5 刚开始,它就像个「笨小孩」,解决个简单问题都要把所有工具试一遍。但通过不断「奖励」那些效率高、更合理的行为,模型就慢慢「开窍」了,知道啥时候该用文本浏览器,啥时候该切换终端「放大招」!
在演示Demo的同时,OpenAI还不忘「轻描淡写」地丢出了几个「凡尔赛」成绩单:
- 在「人类的最后一场大考」(Humanities Last Exam)中,带工具的Agent模式模型,居然拿到了42%的高分,比不带工具的模型直接翻了一倍!
- 更「凡」的是,它还和竞争对手Grok 4 Heavy「隔空」比拼了一下,虽然略逊一筹(Grok 45%),但已是世界领先水平!
- 在网页操作能力(WebArena)和电子表格操作能力(SpreadsheetBench)上,Agent模式虽然还没超越人类,但在网页操作上已经「追近」人类水平!这意味着,即使只是整合现有工具,大模型的潜力依旧是「深不可测」!
Agent时代,我们是「主人翁」还是「打工人」?
Agent模式的爆发,毫无疑问是2025年AI圈的「绝对风口」。但这股风,吹来的不仅是机遇,还有一连串的「灵魂拷问」。
首先,对于那些靠「Agent模式」起家的第三方开发者和初创公司(比如之前的Manus),OpenAI亲自下场,究竟是「催生一个繁荣生态」还是「直接降维打击」?这道题,恐怕只有时间能给出答案。
其次,也是最让人「头皮发麻」的问题:隐私和安全! 当AI在你看不到的「虚拟机」里帮你逛淘宝、输信息,甚至直接下单时,谁来保证你的数据安全?万一它不小心「误入歧途」,被钓鱼网站骗走了你的信用卡号,这锅谁来背?OpenAI虽然信誓旦旦地说会采取「极其严格的审查和安全措施」,但Sam Altman也坦言,整个社会都需要时间去适应和建立规范,就像我们当年学会上网,也要学会甄别诈骗信息一样。6
Sam Altman说:「这是一个全新的范式。就像我们学会上网,最后也学会了甄别诈骗信息一样,现在,整个社会需要学习如何与Agent安全地交互和共存。」 — 这话听着挺真诚,但咱心里还是有点「慌」啊,毕竟AI的「手」要是伸得太长,可就不是幻觉那么简单了!
最后,也是最直击「打工人」灵魂的问题:我的工作,会被AI抢走吗? 当AI能独立完成一份包含数据检索、图像查证的复杂报告,并直接在线预订时,那些天天坐在格子间里的白领们,到底是会被AI「赋能加速」,变成「超级人类」,还是被AI「彻底威胁」,变成「无业游民」?
答案,此刻还在风中「摇曳」。
但无论我们是对此「喜大普奔」、还是「瑟瑟发抖」,亦或是「一脸懵圈」,一个由Agent驱动的、更自动化、更「懂事」的新时代,确实正在以我们肉眼可见的速度,加速狂奔而来。你,准备好迎接这个既刺激又充满挑战的「动手」时代了吗?
引用
-
刚刚,OpenAI 发布了自己的Agent模式,Manus Style·极客公园·Li Yuan(2025/7/18)·检索日期2025/7/18 ↩︎
-
刚刚,OpenAI 发布了自己的Agent模式,Manus Style·科技-新浪·(2025/7/18)·检索日期2025/7/18 ↩︎
-
Introducing ChatGPT agent: bridging research and action·OpenAI·(2025/7/18)·检索日期2025/7/18 ↩︎
-
[PDF] 人工智能专题报告: Operator和Manus打开AI Agent时代·东方财富网·(2025/3/12)·检索日期2025/7/18 ↩︎
-
Introduction to ChatGPT agent·YouTube·Sam Altman, Casey Chu, Isa Fulford, Yash Kumar, and Zhiqing Sun(2025/7/18)·检索日期2025/7/18 ↩︎
-
刚刚,OpenAI 发布了自己的Agent模式,Manus Style·极客公园·Li Yuan(2025/7/18)·检索日期2025/7/18 ↩︎