TL;DR:
作为全球顶尖的医疗AI专家,Maxim Topaz在亲历AI生成的伪造引文危机后,转而揭露学术界正在面临的致命隐患。他警示:若不将自动化核验纳入同行评审标准,人工智能带来的“幻觉”将彻底切断科学论证的证据链。
2026年5月的某一天,对于哥伦比亚大学护理学院副教授Maxim Topaz而言,是一个充满了反讽意味的节点。作为一名长期浸淫在医疗AI领域的顶尖科学家,他深知人工智能的“幻觉”——那种一本正经地胡说八道的算法倾向。然而,当他坐在办公室里,试图用AI工具为一篇即将发表的评论文章进行润色时,他却栽了跟头。
尽管他保持了极高的警惕,甚至手动对引文进行了反复核查,但期刊编辑最终指出的一篇“子虚乌有”的参考文献,如同一记响亮的耳光,打在了这位专家的脸上。这不仅是一个关于技术失误的轶事,更是一个关于科学诚信边界崩塌的缩影。
从“局内人”到“揭秘者”
Topaz并没有因为这次尴尬的经历而选择遮掩,相反,他从中嗅到了一种正在扩散的系统性病灶。作为一名拥有临床医学与数据科学跨学科背景的学者,他敏感地意识到,如果连他这样的专业人士都无法在第一时间识破AI伪造的引文,那么处于科研底层的无数研究者将如何自处?
为了填补这一空白,Topaz带领团队对PubMed Central收录的约250万篇论文进行了地毯式筛查。数据揭示的现实令人不寒而栗:自2023年以来,生物医学论文中的虚假引文造假率涨幅超过12倍。更令他震惊的是,98.4%被识别出的问题论文至今未被更正或撤稿。
“这不再是简单的疏忽,而是整个科学体系根基的动摇。”Topaz在对话中语气沉重,“引文是科研人员验证结论的核心依据。当引用的文献根本不存在,我们实际上是在切断科学论证的证据链。”
综述论文:证据链上的“脆弱环节”
在Topaz的研究中,一个发现尤其令他忧心:综述类论文的引文造假率比普通论文高出57%。在他看来,这绝非偶然。综述论文往往位于临床证据链的上游,是临床诊疗指南制定的基石。
“如果一份指南依托于含有虚假引文的综述,那么整套治疗方案的科学支撑就可能瞬间归零。”Topaz解释道。这种风险正在被医学界严重低估——同行评审制度在面对精心编造的AI假文献时,显得异常脆弱,常规的查重逻辑根本无法触及那些格式规范、署名权威但内容虚假的文献。
亟待重构的学术门槛
面对未来3至5年的科研前景,Topaz毫不掩饰他的担忧:若不及时管控,恶性循环将难以逆转。当这些虚假内容被后续论文引用,甚至被用于训练新一代的人工智能模型,文献库的污染将达到无法修复的程度。
对于如何应对这场“科研危机”,Topaz提出了明确的呼吁:
- 强制核验:出版商必须在同行评审启动前,将自动化引文核验纳入投稿的必经流程。
- 清理存量:面对已发表的“污染”文献,学界需要建立长效的回溯清理机制,尽管这面临巨大的成本和动力障碍。
- 工具辩证法:他强调,问题不在于AI工具本身,而在于科研流程中缺乏有效的“闸门”。“我们并非要禁止人工智能,而是要将核验环节嵌入每一个工作流。”
在这个由算法编织的科研时代,Maxim Topaz的努力像是一种近乎苦行僧式的抗争。他试图在技术加速迭代的洪流中,为科学留存最后一点关于“真实”的尊严。对他而言,这不仅是学术技术的课题,更是一场关于如何守护人类知识底色的持久战。