Google Gemini暴打Nature:一天两篇论文,AlphaFold只是前菜,科学家要慌了?

温故智新AIGC实验室

TL;DR:

谷歌在I/O大会上搞了个大新闻,不仅推出了“Gemini for Science”全家桶,还同天两篇论文登上Nature,让AI自己写代码、自己提假设。这回,科学家们不仅要担心被AI抢饭碗,还得担心AI的论文发得比他们快。

一日两登Nature,Gemini这是要“卷”死谁?

5月19日,科技圈的目光都被Google I/O吸走了。但谷歌悄悄放了个大招,在同一天,Nature杂志上直接上线了两篇论文,作者栏都写着同一个名字:Google。1

这两篇论文,一篇叫ERA(经验性研究助手),另一篇叫Co-Scientist(AI合作科学家)。名字听起来挺正经,但干的事儿可一点都不“正经”。

简单来说,谷歌这是想让AI自己动手,丰衣足食——替科学家写实验代码,帮科学家想研究假设。

这操作,就像你刚点开外卖APP,发现厨师已经帮你把菜炒好了,还顺便把菜单设计好了。

ERA:写代码?AI比你更懂怎么“抄作业”

先说ERA。它的全称叫“Empirical Research Assistance”,目标是让AI自动写出专家级的科学软件。底层是大语言模型+树搜索,说白了就是让AI在代码的森林里自己找路,直到把代码质量拉到人类专家都达不到的高度。

结果呢?这哥们儿交出的成绩单,有点吓人。

  • 生物信息学方向,ERA独立发现了40种新的单细胞数据分析方法,在公开榜单上直接碾压所有人类提交的方案。2
  • 流行病学方向,ERA搞出了14个独立的模型,用来预测传染病住院人数,全部超过了美国CDC(疾控中心)的集成模型。2
  • 更别提它在地理空间分析、斑马鱼神经活动预测等领域的表现,每个都拿得出手。

这哪是“助手”啊,这分明是“卷王”本王。ERA的论文里写道,这系统不只是会跑代码,它能吸收外部的研究思路,然后自己组合出专家水平的解法。这就好比一个学生,不仅能看懂教科书,还能把不同学科的知识点串起来,自己编出一套新解法。

Co-Scientist:提假设?AI比你更会“开脑洞”

如果说ERA是“码农型”AI,那Co-Scientist就是“科研大佬型”AI。它基于Gemini,搞了个多智能体系统,核心机制叫“点子锦标赛”(idea tournament)。3

多个智能体在里面互相生成假设、互相辩论、互相批判,最后优胜劣汰,把最靠谱的假设留给你。而且随着你给它更多时间思考(测试时计算扩展),它提出的假设质量还会持续提升。

论文重点验证了三个场景:药物再利用、新靶点发现、抗微生物耐药机制解释3其中急性髓系白血病(AML)的药物再利用候选方案,已经在斯坦福医学院的实验室里得到了体外验证。3

这感觉就像,你还在为科研课题发愁,AI已经帮你把实验方案、目标分子、甚至可能的副作用都想好了,就差你下单买试剂了。

三个Labs,把科研流水线拆得明明白白

除了两篇Nature论文,谷歌还同步开放了三个Labs实验原型,对应科学研究最核心的三个步骤:1

  1. Hypothesis Generation(假设生成): 底层就是刚才说的Co-Scientist,有Nature论文撑腰。你输入一个研究方向,它给你生成一堆假设,每条还附带可点击的文献引用,有理有据,防杠精。
  2. Computational Discovery(计算发现): 底层是AlphaEvolve加ERA,ERA刚发了Nature,AlphaEvolve则是DeepMind自家的明星产品。这套引擎能并行生成数千个代码变体,自动评分,把原本需要人类专家耗时数月摸索的复杂建模路径,压缩到机器搜索的范围内。谷歌点名了太阳能预测和流行病学两个场景。
  3. Literature Insights(文献洞察): 底层是NotebookLM,目前没有Nature背书,但功能很实在。它能把文献结构化,变成可搜索的属性表格,还能直接产出报告、幻灯片、信息图、音视频概览。

这三大件儿一凑,基本上就把科研的前期流程给包圆了。谷歌的意思是:别再用传统方法苦苦挣扎了,来我们这儿,一键生成。

BASF的难题,AI用了80%的准确率提升

光说技术可能有点虚,谷歌还扔出了一个实打实的案例:全球化工巨头BASF。4

BASF面对什么问题?180个生产基地,5000多条价值链,有些产品的物料清单深达30层。人类规划员每天要做几千个本地决策,但没人能看清局部决策如何影响全球供应链。4

BASF高级供应链副总裁自己都说了:“我们此前多次尝试用确定性模型建数字孪生,均告失败。”4

然后,谷歌的AlphaEvolve上场了。它被喂入了一段“种子程序”和三年历史数据(库存、需求、产出等),然后开始自动生成代码变体,发现供应链运作的内在规律。

结果呢?AlphaEvolve自动提炼出了三条传统建模里需要专家手工编码的规则:生产整合、动态安全库存、网络级协调。4

最终,相比最初的种子模型,最新一轮AlphaEvolve的运行结果在准确率上实现了超过80%的相对提升4

BASF下一步计划用这套数字孪生覆盖整个全球生产网络。这告诉我们一个道理:有时候,人类想破头都解决不了的问题,交给AI,它可能就用代码给“暴力破解”了。

争夺“可信验证”的入场券

谷歌这一套组合拳,目标很明确:抢占“AI for Science”的信用制高点

Nature论文就是那张入场券。谷歌用同行评审为整套工具链做信用背书,让科学家面对系统时有个心理锚点:“这玩意儿发过Nature,应该靠谱。”

目前,谷歌已经公开了超过100家合作机构,包括斯坦福大学、帝国理工学院、Crick研究所等。1 他们甚至建立了一个从博士生到诺奖得主都包括的“可信测试者”社区,专门给系统找漏洞。

更狠的是,谷歌还在跟ICML、STOC、NeurIPS等顶级学术会议合作,开发智能体同行评审工具PAT(论文助手工具)和ScholarPeer。1

这意味着什么?科学可信度基础设施,正在成为新的竞争场地。 谁的AI建议能被引用,谁的假设经得起审计,谁的系统能被顶级期刊工作流接入,谁就能在未来的科研生态里扎根。

三英战AI:OpenAI、Anthropic、Google,谁主沉浮?

谷歌这次是压上了Nature论文、100多家机构、ERA和Co-Scientist。但竞争对手们也没闲着:

  • OpenAI 4月推出了GPT-Rosalind,主打生物学、药物研发和转化医学的前沿推理。5
  • Anthropic 把Claude for Life Sciences接入了AWS Marketplace,对接Databricks和Snowflake做大规模生物信息学分析。5

三家科技巨头,都把“科学”单独拆出来做成了产品线。接下来竞争的,将是谁的平台能成为科学家信赖并依赖的首选。

科研圈,真的要变天了。而我们,可能正在见证一个新时代的开端——一个AI跟人类科学家抢着发论文的时代。


  1. Gemini for Science·Google AI·https://ai.google/gemini-for-science·检索日期2026/5/25 ↩︎ ↩︎ ↩︎ ↩︎

  2. ERA论文·Nature·https://www.nature.com/articles/s41586-026-10658-6·检索日期2026/5/25 ↩︎ ↩︎

  3. Co-Scientist论文·Nature·https://www.nature.com/articles/s41586-026-10644-y·检索日期2026/5/25 ↩︎ ↩︎ ↩︎

  4. How BASF manages thousands of supply chain decisions with AlphaEvolve·Google Cloud Blog·https://cloud.google.com/blog/products/ai-machine-learning/how-basf-manages-thousands-of-supply-chain-decisions-with-alphaevolve·检索日期2026/5/25 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  5. Gemini for Science - Google AI·Google AI·https://ai.google/gemini-for-science·检索日期2026/5/25 ↩︎ ↩︎