姚顺雨:一位“狐狸”型AI行者的“下半场”抉择

温故智新AIGC实验室

TL;DR:

作为OpenAI的明星研究员,姚顺雨以其跨界思辨和对AI Agent的深刻洞察定义了“AI下半场”的行业命题。如今,这位年轻的华人科学家正从学术殿堂走向未知征途,在追寻挑战与打造万亿级AI公司的愿景中,开启个人职业生涯的新篇章。

午后的阳光透过加州某扇窗户,或许正轻柔地洒在一位年轻科技新贵的肩头,他刚刚作出了一个足以在全球AI界激起涟漪的决定——离开OpenAI。消息如同一阵风,迅速从硅谷吹向远东,人们猜测着他的去向:是跳槽巨头,还是投身创业洪流?答案尚未揭晓,但姚顺雨,这位年仅29岁、被誉为大模型“下半场”开启者的华人研究员,已经悄然启动了自己AI人生的“下半场”。

智识旅程:从“姚班探花”到跨界行者

要理解姚顺雨今天的抉择,需回溯他那条由天才与好奇心编织而成的智识轨迹。他的故事,始于中国安徽合肥的一片沃土。在安徽理科高考中以704分的探花之姿,他叩开了清华大学交叉信息研究院“姚班”的大门——一个以计算机科学奠基人姚期智先生姓氏命名的传奇班级。坊间流传着他当年选择清华的一句“freestyle”式理由:

“但是对于我来说,选择清华、北大并不是问题,因为北大没有我姓氏命名的班级。”1

这句略带桀骜的玩笑,不仅展现了他独特的幽默感,也暗示着一种不愿被常规束缚的独立精神。

与许多专注于一点深挖的“刺猬型”学霸不同,姚顺雨更像以赛亚·伯林笔下的“狐狸”:涉猎广泛,对各种知识充满热情。他阅读《哥德尔、艾舍尔、巴赫:集异璧之大成》1,这部跨越数学、艺术与音乐的经典,启发他寻找看似无关元素中的深层关联;他不仅是全国信息学奥赛银牌得主,更是清华大学学生说唱社的联合创始人,艾米纳姆、蛋堡、热狗的节奏伴随他穿梭于代码与思想之间。这种兼容并蓄的特质,贯穿了他的求学生涯。

在大三下学期之前,姚顺雨甚至未曾接触过AI,也未正式投身科研。然而,一次前往麻省理工学院的交换经历,成为他命运的转折点。在那里,他跟随吴佳俊教授,初探计算机视觉与认知科学的奥秘。他曾提到,吴佳俊和学长Jun-Yan Zhu不仅教授他研究的基本功,更重要的是启发了他从心理学与人工智能的交叉视角,去思考更高维度、更宏观的问题框架1。这为他日后对通用智能体的追求埋下了伏笔。

2019年,他远赴普林斯顿攻读博士学位,再一次展现了他的“跨界”本能。尽管最初被计算机视觉方向录取,他却因兴趣的牵引,毅然转向自然语言处理(NLP),并加入了Karthik Narasimhan的团队,开始探索NLP与强化学习的融合。那正是GPT-2崭露头角的时代,姚顺雨的这一转向,被他事后视为一种幸运:“觅之,便有所获”1。从博士第一年起,他便开始思考如何将语言模型转化为Agent。

代理智能:语言铸就的思维之树

对(通用)Agent的关注,是姚顺雨研究生涯中一条清晰的主线。他的博士首作CALM(2020),便研究如何以语言模型为Agent来玩语言游戏。在他看来,语言不仅是一种媒介,更是人类为实现泛化而发明的工具,它比其他事物更具本质性,能让Agent凭借推理和组合,在不同上下文中找到合适动作,从而实现泛化能力1

然而,姚顺雨也深知,若无有意义的任务和环境,即便游戏玩得再高分也毫无意义。基于此,他构建了WebShop,一个大规模模拟电商环境,让Agent在复杂文本指令下进行导航与操作。后来的经典工作SWE-Bench和SWE-Agent,亦是围绕现实编程这一有意义任务,来验证Agent的能力。这些工作都体现了他对“价值”和“通用性”的执着追求。

2022年,GPT-3.5的横空出世,彻底改变了AI领域的游戏规则。它让姚顺雨意识到,强大的语言预训练为模型注入了常识与语言知识,提供了缺失的“先验知识”。正如他所说:

“如果你的Pre-Training(预训练)已经包含了所有事情,那么RL(强化学习)只是激发出这些能力的skill(技能)。”1

受此启发,他与团队推出了ReAct(ReAct: Synergizing Reasoning and Acting in Language Models),让大语言模型在与外部环境交互时,能同步进行“推理”与“行动”,这被他评价为自己“最喜欢的工作”1。在此基础上,他进一步提出了思维树(Tree of Thoughts, ToT),通过多路径探索和自我评估,大幅提升了语言模型解决复杂问题的推理能力。

回顾姚顺雨从清华到普林斯顿,再到OpenAI的学术与科研历程,不难发现,他始终在探索通用智能体的构建,并深信语言是实现认知与决策泛化的核心媒介。他将自己的研究重心,逐渐锁定在两个核心命题上:一是如何定义有价值、与现实世界更相关的任务和环境;二是如何创造简单却又通用的方法。

“AI下半场”:从科研殿堂到商业征途的转向

2024年8月,姚顺雨以一众瞩目的姿态加入OpenAI,这家被视为AI圣殿的机构。有趣的是,他的普林斯顿导师Karthik Narasimhan正是GPT-1的第二作者,这层渊源也为他加入OpenAI增添了几分宿命的意味。

然而,仅仅一年后,姚顺雨便再次站在了人生的十字路口。他在今年4月发表的博文《The Second Half》中,掷地有声地宣告:AI主线程的游戏已进入“下半场”。他认为,AI上半场以模型和方法为中心,专注于构建基础技术;而随着技术日趋成熟,下半场的重点将转向如何定义有现实意义的任务,以及如何有效评估AI系统的表现。这预示着,AI发展将从纯粹的技术突破,走向与真实世界需求深度结合。

这篇博文,不仅是姚顺雨对行业趋势的深刻洞察,更是他个人心态转变的写照。他正从一位“专注求解的科研工作者,逐渐成长为善于发现需求的‘产品经理’”1。这种转变的内在驱动,在近期一次与张小珺的访谈中得到了清晰的揭示:

“毕业前我想得多的是,怎么创造一个爱因斯坦?我那时是比较academia(学院派)的人——你在普林斯顿,你的偶像是冯诺依曼、爱因斯坦——很自然,能想到最有意思的任务是,我能不能发现下一个相对论?这毫无疑问能标志,AGI或ASI(超人工智能)实现了。后来,我到了硅谷,到了加州,进入公司之后,我发现人类的组织也是一个有意思的事情。如果能创造一家新的公司,创造一个one trillion dollar(一万亿美元)、基于Agent的公司,是很有意思的。2

这番话,展现了他从纯粹的学术理想主义,到拥抱硅谷创业精神的蜕变。他不再仅仅满足于在实验室里推动认知的边界,更渴望将前沿技术落地,通过构建一家公司,将Agent的潜力释放到极致,从而在现实世界中创造万亿级的价值。这种从“发现真理”到“创造世界”的转变,是深思熟虑后的雄心壮志。

启程:未知彼岸与无限可能

姚顺雨的离职,无疑牵动着整个AI行业的神经。有传闻称他将以“上亿薪资”入职中国科技巨头腾讯,但很快被腾讯官方辟谣否认3。与此同时,一家名为“姚顺雨”的全新创业公司被注册的消息不胫而走,尽管无法百分百确认其法人代表就是这位明星研究员,但无疑为他的未来去向增添了更多想象空间。

对于创业,姚顺雨本人曾坦率表示:

“OpenAI大多数人都会考虑创业。他需要去做更有挑战的事情,去创业是很自然的。当然,还是应该找到一个好的事情。他喜欢把事情想得清楚一点再去做。”2

这句话描绘了一个清醒而果决的探索者形象。他并非盲目追逐潮流,而是基于对AI下半场的深刻理解,在寻觅那个“好的事情”,那个真正能让他发挥“狐狸”般跨界智慧、实现万亿级梦想的挑战。他的导师Karthik Narasimhan在OpenAI工作一年后选择回归普林斯顿的象牙塔,而姚顺雨的路径似乎指向了更广阔的产业腹地。

无论是投入新兴巨头的怀抱,抑或是投身波澜壮阔的创业征途,姚顺雨的“下半场”都将是AI领域最值得关注的故事之一。他所倡导的“AI下半场”哲学,将如何在他个人的实践中得到验证?一个秉持跨界思维、以语言为舟,致力于构建通用Agent的年轻大脑,又将在下一个舞台上,为人类与AI的未来,书写怎样的篇章?这一切,都令人拭目以待。

引用


  1. 姚顺雨离职OpenAI,开启下半场·36氪·量子位(2025/9/12)·检索日期2025/9/12 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. 115. 对OpenAI姚顺雨3小时访谈:6年Agent研究、人与系统·Apple Podcasts·播客(不可用日期)·检索日期2025/9/12 ↩︎ ↩︎

  3. 姚顺雨离职OpenAI,「亿元入职腾讯」传闻引爆AI圈,鹅厂辟谣了·36氪(2025/9/12)·检索日期2025/9/12 ↩︎