NeurIPS论文“假开源”被锤爆:代码Coming Soon,仓库404,科研圈也有“画饼大师”?

温故智新AIGC实验室

TL;DR:

AI学术圈的“画饼大师”们这次真的踢到钢板了!一位较真的研究员用AI系统“查水表”,扒出了NeurIPS 2024近百篇挂着开源链接却空无一物的假论文。如果你的Star还在等那句“Coming Soon”,别傻了,那大概率是“Coming Never”。

就在大家还沉浸在AI技术日新月异的幻梦中时,2026年的钟声敲响,有些科研圈的“老账”终于被翻出来了。

较真还得是程序员。最近,一位匿名AI研究员因为受够了被“Code coming soon”浪费时间,直接掏出了自己Vibe Coding出来的AI核查系统,对着AI领域最顶级的会议NeurIPS 2024来了一场“大扫除”。1

结果不查不知道,一查全是坑。

仓库点开全是寂寞,是谁在“学术放鸽子”?

这位研究员利用AI Agent,融合了OpenReview、GitHub API和PDF解析技术,对NeurIPS 2024收录的4035篇论文进行了拉网式排查。

数据说明了一切:在4000多篇论文中,有2404篇是真开源,1533篇压根没给链接(这倒也算坦荡)。最尴尬的是剩下的98篇:它们在论文里白纸黑字写着“代码已开源”,还像模像样地贴上了GitHub地址,结果点进去一看,要么是404,要么是只有一封README文件的空仓库。1

调侃一下: 这种行为在圈内有个优雅的称呼叫“占坑”,但在广大急需复现代码的开发者眼里,这简直就是“学术钓鱼”。

更刺激的是,这份名单是指名道姓的,从作者到机构统统曝光。这种“对事也对人”的打法,让不少学术大厂和名校实验室集体“破防”。

为什么“假开源”成了圈内潜规则?

你可能会问,这些大佬们差那点写代码的时间吗?其实,背后的水比你想象的要深。

  1. 审稿加分的“潜规则”:从2021年起,NeurIPS等顶会引入了“可复现性检查表”(Reproducibility Checklist)。1 为了拿到高分,勾选“愿意开源”几乎成了基操。只要仓库链接在那,审稿人通常不会真的点进去查你代码跑不跑得通。
  2. 工业界的“流程黑洞”:很多大厂论文需要经过漫长的法务和合规审批。团队为了先占住Idea,往往先丢个空仓库,结果审着审着,项目组可能都撤了,代码自然成了“失踪人口”。
  3. 复现门槛的“遮羞布”:有些项目动辄烧几百张卡,数据又是内部不公开的。放了代码你也跑不动,甚至可能被看出逻辑破绽,索性就让它永远保持在“Soon”的状态。

从“氛围代码”到“氛围引用”,AI正在制造学术幻觉

其实,假开源只是冰山一角。根据GPTZero等机构的调查,AI顶会的诚信危机正在全方位升级。

现在的论文里不仅有“假代码”,还有“假引用”。有一种现象叫**“氛围引用”(Vibe Citing)**:大模型在辅助写论文时,会凭空捏造出一些看起来非常合理的参考文献。2

离谱到什么程度?图灵奖得主Yann LeCun的名字,竟然以“Samuel LeCun Jackson”这种虚构形式出现在了正式论文里。2 甚至还有论文引用了名为“John Smith”的占位符作者。这些连链接都指向404的低级错误,竟然悉数骗过了每篇论文至少三名的专家评审。

行业地震:学术圈开始“排雷”了

面对这种“投稿海啸”带来的诚信崩塌,顶会们终于坐不住了。

据悉,ICLR 2026已经启动了严格的“人机共治”模式,联手GPTZero等工具对抗AI生成的虚假内容。2 任何被发现大量使用AI未披露或存在虚假引用的论文,将直接面临“桌拒”(Desk Reject)的命运。

正如那位匿名研究员所说:“菜不是原罪;但当贪欲迫使你献祭学术道德来换取虚名时,这就是罪。”

在Agentic AI崛起的时代,深度核查学术诚信的成本将趋近于零。谁在脚踏实地,谁在投机取巧,在大数据下面前都将无所遁形。毕竟,科研最该被“Fork”和“Star”的,永远是那颗求真的心。

引用


  1. NeurIPS论文假开源,较真AI研究员开锤了 · 量子位 · 关注前沿科技 (2026/2/4) · 检索日期2026/2/4 ↩︎ ↩︎ ↩︎

  2. 华裔00后戳破顶会泡沫!NeurIPS 53篇论文曝AI造假,LeCun躺枪 · 澎湃新闻 · 36氪经授权发布 (2026/2/4) · 检索日期2026/2/4 ↩︎ ↩︎ ↩︎