首页
洞察
早报
日报
主题探索
关于
科学评测
洞察 Insights
从代码复现到科学超越:NatureBench 为 AI Agent 勾勒“科研自主”的分水岭
NatureBench 通过标准化科研任务集,量化了 AI Agent 在真实科学研究中的原创性改进能力。这项研究揭示了 AI 从辅助科研向“自主科学发现者”进化的潜力与边界,为未来 AI for Science 的工具开发奠定了评价基石。
阅读全文