偷书毁书一条龙，Claude的15亿美元“知识付费”大冤种实录

TL;DR：

AI巨头Anthropic（Claude亲爹）先是用盗版电子书喂模型，被作家集体索赔15亿美元；转头又搞了个“巴拿马计划”——买来百万实体书，切开扫描再销毁，就为了绕过版权雷区。最后律师和作者为分钱吵翻天，法官都看不下去了。这波操作，只能说：AI的“读书”姿势，比你想象中更野。

如果你以为AI公司只是偷偷爬个网页、薅点网络数据就完事了，那你就太天真了。2025年，一群作家把Claude的爹——Anthropic告上了法庭，最终拿到了一份15亿美元的和解协议。这本来是一个关于创作尊严、AI伦理、硅谷巨头与普通写作者博弈的宏大故事。但故事走到最后一幕，最热闹的话题不是AI，不是版权——而是律师费。

原告律师们一开始“谦虚”地要了3亿美元。而被侵权的作者们一算：每部作品大约只能分到3000美元，版权方还得再切一刀。作者们当场就不干了：“你律师拿得比我写的书还多？”法官也摇头。甚至连被告Anthropic都跳出来反对。这场大戏，到底是怎么演变成今天这个局面的？

偷书不算偷？AI的“盗版式学习”有多野

“书中自有黄金屋”——AI公司比谁都懂。相比网上那些帖子、文章，书籍里的文本质量简直是顶配蛋白粉。用书籍训练AI，早就是行业公开的秘密。

2023年，有人扒开了AI圈广泛使用的训练文本库“The Pile”，发现里面藏着一个叫“Books3”的数据集——近20万册图书，全是从盗版网站扒来的。惊悚小说家安德里亚·巴茨好奇搜了一下自己的名字，好家伙，自己的作品赫然在列。她二话不说，联合其他作者，一纸诉状把Anthropic告上了法庭¹。

更劲爆的还在后头。法庭文件显示，Anthropic联合创始人本杰明·曼恩，早在2021年就开始疯狂下载盗版电子书——半年内从盗版网站pull了500万本。到了2022年，一个新盗版网站上线，曼恩不仅自己下了200万本，还兴高采烈地给同事发链接：“真是太及时了！！！”（just in time!!!）²

另一位联合创始人、CEO达里奥·阿莫代伊也知情。当被问为啥不去买正版授权时，他的理由简单粗暴：“法律/实践/商业上的繁琐工作”——说白了，就是嫌麻烦。

2025年6月，法官一纸简易判决：从盗版网站下载并长期持有书籍，不构成合理使用。“每一个已知是盗版的下载行为，都是一次侵权。” Anthropic最终同意赔付15亿美元，并销毁所有盗版内容³。

💡 点评：一个“嫌麻烦”，代价15亿美元。这大概是史上最贵的“麻烦”了。

法官说：AI读书不算偷。然后Anthropic就真把书撕了

就在大家以为作者们“大获全胜”时，判决的另一部分却让AI公司笑出了声：如果用合法获取的书籍训练AI，属于“极具变革性”的合理使用。

什么意思？只要书是正版的，你尽管喂AI，不侵权。

Anthropic一听，眼神都亮了。然后他们干了一件让出版业集体窒息的事——巴拿马项目（Project Panama）。

2026年初，媒体曝光：Anthropic的员工把买来的实体书一页页切下书脊，逐页扫描，再把碎纸送去回收。一年内，他们花费数千万美元，破坏式扫描了数百万本实体书⁴。

这操作合理吗？法官认为是合理的。他把AI训练类比成人类阅读：“作者无权禁止任何人将他们的作品用于培训或学习。每个人都会读书，也会创作新作品。如果要求每次阅读、每次回忆都付费，那就太不可思议了。”⁵

但作家和伦理学者炸了锅：AI是“读”书吗？它是在无脑复制模式，用几千本小说生成同类型内容，这能跟人类学习相提并论？更讽刺的是，Anthropic一边销毁实体书，一边声称这是“为了保护版权”——毕竟只有扫描版才能合法训练，纸书留着也没用。

🤯 魔幻现实：为了“合法”训练AI，他们亲手毁掉了书——这是真·纸质书末日。

15亿美元和解金：作者分3000，律师分1.875亿

官司打到2026年，双方终于达成15亿美元和解。但好戏才刚刚开始——分钱环节。

原告律师团队最初提出要拿走20%，也就是3亿美元。理由是：跟其他巨额赔偿案比，这已经很“保守”了。法官皱眉头，Anthropic也反对，连原告作者都翻白眼：“我每部作品才拿3000块（还得跟版权方分），律师一张嘴就要走1/5？”

2026年3月，律师们“妥协”到12.5%，即1.875亿美元。但即便如此，在最终审批听证会上，依然有7位反对者站出来质疑⁶。

不过，超过90%的作品已经接受了和解。按目前局势，协议大概率会通过。但这场闹剧已经彻底暴露了集体诉讼的尴尬：打官司的律师赚得盆满钵满，真正受伤的作者只够买几杯咖啡。

💸 一句话总结：AI偷书赔了15亿，作者到手3000块，律师笑纳1.8亿。谁赢了？谁输了？答案似乎很明显。

AI的“读书权”之争，才刚刚开始

这个案子留下了一个巨大的灰色地带：用正版书训练AI，到底合不合法？

美国法院目前的说法是：这是“高度变革性”的，属于合理使用。但其他国家的法官未必买账（中国杭州互联网法院就曾认为AI训练数据属合理使用，但也强调输出阶段要严控侵权⁷）。更别说，Anthropic这种“买书→毁书→扫描”的骚操作，简直是在法律边缘疯狂试探。

未来会怎样？也许我们会看到一种新的商业模式：AI公司批量购买电子书授权，或者干脆自己建个“AI读书俱乐部”。作者们可能需要重新定义“创作”——毕竟，当AI能一秒读完你一辈子写的书，然后写出比你更“畅销”的故事时，写作这件事本身就变了味。

但至少有一件事是确定的：下次再有人吹嘘AI“博学多才”，你可以告诉他——那些书，可能是被撕碎后喂进去的。

引用

Revealed: The Authors Whose Pirated Books Are Powering Generative AI · The Atlantic · （2023/8/19）· 检索日期2026/6/8 ↩︎
The Thriller Writer Who Took on a Tech Giant · The New York Times · （2025/10/3）· 检索日期2026/6/8 ↩︎
Authors v Anthropic ruling · DocumentCloud · （2025/6/23）· 检索日期2026/6/8 ↩︎
Inside an AI start-up’s plan to scan and dispose of millions of books · The Washington Post · （2026/1/27）· 检索日期2026/6/8 ↩︎
Anthropic’s AI copyright ‘win’ is more complicated than it looks · Fast Company · （2025/6/24）· 检索日期2026/6/8 ↩︎
Anthropic asks judge to slash legal fees in $1.5 billion settlement · Reuters · （2025/12/18）· 检索日期2026/6/8 ↩︎
生成式AI输入环节的训练语料著作权侵权风险问题 · 金杜律师事务所 · （2025/7/18）· 检索日期2026/6/8 ↩︎