诺奖得主要自证没作弊?人类陷入“反向图灵测试”:AI越来越强,我却越来越不像人

温故智新AIGC实验室

TL;DR:

当AI能写出比人类更“有人味儿”的小说,画师需要直播画画来证明自己不是AI,连诺贝尔奖得主都得澄清“我不是AI写的”——人类集体陷入了一场荒诞的“反向图灵测试”。更扎心的是,我们手里的检测工具,连自己的判断都站不住脚。


今年五月,文学圈炸了两次。

第一次,英联邦短篇小说奖的获奖作品被AI检测工具Pangram判定为“100% AI生成”——铁证如山?主办方用Claude复核,结果另一个AI说:我确定不了。好家伙,AI鉴定AI,场面一度十分尴尬。

第二次,诺贝尔文学奖得主奥尔加·托卡尔丘克,新书还没上市就被质疑是AI代笔。理由?她在采访里提了一句“会用AI辅助构思和资料整理”。结果她不得不公开喊话:“我这辈子都是自己写的,新书不是AI写的!”

你看,过去是机器拼命通过图灵测试,证明自己像人;现在变成了人类拼命证明自己不是机器。一场“反向图灵测试”,正在全网展开。

文学圈开撕:你的“人味”经得起检测吗?

先聊聊那篇倒霉的获奖小说。作者贾米尔·纳齐尔的作品拿下了英联邦短篇小说奖加勒比地区奖,还登上了文学杂志Granta。读者们读完觉得不对劲——“比喻太杂、句式太整齐、修辞像是批量生成的。”随后Pangram出手:100% AI生成。

但Granta用Claude一测,结果模棱两可。英联邦基金会只能表示“所有入围作者都确认没使用AI”——检测工具给出的100%,居然没法当证据用。

更扎心的是《纽约客》做过一项实验:用多位作家的作品微调AI模型,然后让创意写作专业的学生在两段文本里选更喜欢的。结果三分之二的案例中,AI模仿版赢了。学生们甚至会把AI写的句子当成作家的真迹,把作家亲笔写的批评成“像AI”。

当AI比人更像“人”,人类靠什么证明自己?

画师们的“直播自证”与千元对赌

文学圈只是冰山一角。在绘画圈,这出戏更夸张。

你刷社交平台,经常能看到画师发帖:“终究轮到我了。”紧接着是录屏展示所有图层、画布过程,甚至开直播多机位——一个机位拍屏幕,一个机位拍画师本人,以防“代笔”。如果没录屏,还有“对赌”:怀疑方和被怀疑方押上两千块,约定一场绘画直播,现场验明正身。

但最荒诞的是,有博主故意发了一张莫奈真迹,假装是AI生成的“莫奈风格图”,让网友“详细分析为什么不如真迹”。评论区立刻涌入一堆“AI鉴定师”,从笔触、颜色、空间感逐条批判——最后反转:这就是莫奈本人画的。

鉴AI到底谁说了算?工具不靠谱,人眼更离谱

检测工具为什么靠不住?Pangram官网自己解释:它用的不是DNA鉴定,而是模式识别——分析词汇选择、句子节奏、结构安排,判断“像不像AI写的”。本质上,它的输出只是一个概率,不是铁证。

更麻烦的是,非英语母语写作者更容易被误伤。斯坦福大学2023年测试了7个检测器,拿91篇托福作文(全是学生手写)一测,平均误报率61%,18篇被7个工具一致判为AI生成。说白了,写得规整、模板化,反倒成了嫌疑犯。

至于肉眼鉴定——那位莫奈事件已经说明一切。

说好的水印呢?AI公司也头疼

理论上,AI生成的内容应该自带“出生证明”。业界主要有两种:元数据(C2PA内容凭证)和隐形水印(如谷歌SynthID)。谷歌、Meta、OpenAI都在做,但问题一堆:元数据截图就丢,水印能被裁剪或重编码,更关键的是——文本水印迟迟没落地。

OpenAI内部早在2023年就开发出了一款文本水印工具,号称对够长的ChatGPT文本有效率达99.9%,但最终没发布。原因?《华尔街日报》报道说:OpenAI担心用户反弹,近30%用户表示如果启用文本水印就会减少使用。

于是,一个死循环出现了:AI越来越强,检测工具越来越被动,而人类只能继续“自证清白”。也许有一天,“AI参与”成为默认状态,“人类原创”变成稀有品,这场拉扯才会失去意义。

但在那之前,如果你看到一张画、一段文字,别急着说“AI味太重”——说不定对方只是个被AI逼疯的、拼命想证明自己不是AI的人类。