TL;DR:
AI巨头Anthropic(Claude亲爹)先是用盗版电子书喂模型,被作家集体索赔15亿美元;转头又搞了个“巴拿马计划”——买来百万实体书,切开扫描再销毁,就为了绕过版权雷区。最后律师和作者为分钱吵翻天,法官都看不下去了。这波操作,只能说:AI的“读书”姿势,比你想象中更野。
如果你以为AI公司只是偷偷爬个网页、薅点网络数据就完事了,那你就太天真了。2025年,一群作家把Claude的爹——Anthropic告上了法庭,最终拿到了一份15亿美元的和解协议。这本来是一个关于创作尊严、AI伦理、硅谷巨头与普通写作者博弈的宏大故事。但故事走到最后一幕,最热闹的话题不是AI,不是版权——而是律师费。
原告律师们一开始“谦虚”地要了3亿美元。而被侵权的作者们一算:每部作品大约只能分到3000美元,版权方还得再切一刀。作者们当场就不干了:“你律师拿得比我写的书还多?”法官也摇头。甚至连被告Anthropic都跳出来反对。这场大戏,到底是怎么演变成今天这个局面的?
偷书不算偷?AI的“盗版式学习”有多野
“书中自有黄金屋”——AI公司比谁都懂。相比网上那些帖子、文章,书籍里的文本质量简直是顶配蛋白粉。用书籍训练AI,早就是行业公开的秘密。
2023年,有人扒开了AI圈广泛使用的训练文本库“The Pile”,发现里面藏着一个叫“Books3”的数据集——近20万册图书,全是从盗版网站扒来的。惊悚小说家安德里亚·巴茨好奇搜了一下自己的名字,好家伙,自己的作品赫然在列。她二话不说,联合其他作者,一纸诉状把Anthropic告上了法庭1。
更劲爆的还在后头。法庭文件显示,Anthropic联合创始人本杰明·曼恩,早在2021年就开始疯狂下载盗版电子书——半年内从盗版网站pull了500万本。到了2022年,一个新盗版网站上线,曼恩不仅自己下了200万本,还兴高采烈地给同事发链接:“真是太及时了!!!”(just in time!!!)2
另一位联合创始人、CEO达里奥·阿莫代伊也知情。当被问为啥不去买正版授权时,他的理由简单粗暴:“法律/实践/商业上的繁琐工作”——说白了,就是嫌麻烦。
2025年6月,法官一纸简易判决:从盗版网站下载并长期持有书籍,不构成合理使用。“每一个已知是盗版的下载行为,都是一次侵权。” Anthropic最终同意赔付15亿美元,并销毁所有盗版内容3。
💡 点评:一个“嫌麻烦”,代价15亿美元。这大概是史上最贵的“麻烦”了。
法官说:AI读书不算偷。然后Anthropic就真把书撕了
就在大家以为作者们“大获全胜”时,判决的另一部分却让AI公司笑出了声:如果用合法获取的书籍训练AI,属于“极具变革性”的合理使用。
什么意思?只要书是正版的,你尽管喂AI,不侵权。
Anthropic一听,眼神都亮了。然后他们干了一件让出版业集体窒息的事——巴拿马项目(Project Panama)。
2026年初,媒体曝光:Anthropic的员工把买来的实体书一页页切下书脊,逐页扫描,再把碎纸送去回收。一年内,他们花费数千万美元,破坏式扫描了数百万本实体书4。
这操作合理吗?法官认为是合理的。他把AI训练类比成人类阅读:“作者无权禁止任何人将他们的作品用于培训或学习。每个人都会读书,也会创作新作品。如果要求每次阅读、每次回忆都付费,那就太不可思议了。”5
但作家和伦理学者炸了锅:AI是“读”书吗?它是在无脑复制模式,用几千本小说生成同类型内容,这能跟人类学习相提并论?更讽刺的是,Anthropic一边销毁实体书,一边声称这是“为了保护版权”——毕竟只有扫描版才能合法训练,纸书留着也没用。
🤯 魔幻现实:为了“合法”训练AI,他们亲手毁掉了书——这是真·纸质书末日。
15亿美元和解金:作者分3000,律师分1.875亿
官司打到2026年,双方终于达成15亿美元和解。但好戏才刚刚开始——分钱环节。
原告律师团队最初提出要拿走20%,也就是3亿美元。理由是:跟其他巨额赔偿案比,这已经很“保守”了。法官皱眉头,Anthropic也反对,连原告作者都翻白眼:“我每部作品才拿3000块(还得跟版权方分),律师一张嘴就要走1/5?”
2026年3月,律师们“妥协”到12.5%,即1.875亿美元。但即便如此,在最终审批听证会上,依然有7位反对者站出来质疑6。
不过,超过90%的作品已经接受了和解。按目前局势,协议大概率会通过。但这场闹剧已经彻底暴露了集体诉讼的尴尬:打官司的律师赚得盆满钵满,真正受伤的作者只够买几杯咖啡。
💸 一句话总结:AI偷书赔了15亿,作者到手3000块,律师笑纳1.8亿。谁赢了?谁输了?答案似乎很明显。
AI的“读书权”之争,才刚刚开始
这个案子留下了一个巨大的灰色地带:用正版书训练AI,到底合不合法?
美国法院目前的说法是:这是“高度变革性”的,属于合理使用。但其他国家的法官未必买账(中国杭州互联网法院就曾认为AI训练数据属合理使用,但也强调输出阶段要严控侵权7)。更别说,Anthropic这种“买书→毁书→扫描”的骚操作,简直是在法律边缘疯狂试探。
未来会怎样?也许我们会看到一种新的商业模式:AI公司批量购买电子书授权,或者干脆自己建个“AI读书俱乐部”。作者们可能需要重新定义“创作”——毕竟,当AI能一秒读完你一辈子写的书,然后写出比你更“畅销”的故事时,写作这件事本身就变了味。
但至少有一件事是确定的:下次再有人吹嘘AI“博学多才”,你可以告诉他——那些书,可能是被撕碎后喂进去的。
引用
-
Revealed: The Authors Whose Pirated Books Are Powering Generative AI · The Atlantic · (2023/8/19)· 检索日期2026/6/8 ↩︎
-
The Thriller Writer Who Took on a Tech Giant · The New York Times · (2025/10/3)· 检索日期2026/6/8 ↩︎
-
Authors v Anthropic ruling · DocumentCloud · (2025/6/23)· 检索日期2026/6/8 ↩︎
-
Inside an AI start-up’s plan to scan and dispose of millions of books · The Washington Post · (2026/1/27)· 检索日期2026/6/8 ↩︎
-
Anthropic’s AI copyright ‘win’ is more complicated than it looks · Fast Company · (2025/6/24)· 检索日期2026/6/8 ↩︎
-
Anthropic asks judge to slash legal fees in $1.5 billion settlement · Reuters · (2025/12/18)· 检索日期2026/6/8 ↩︎
-
生成式AI输入环节的训练语料著作权侵权风险问题 · 金杜律师事务所 · (2025/7/18)· 检索日期2026/6/8 ↩︎