AI版权之争：Anthropic案判决如何重塑“合理使用”与大模型训练的未来

一项具有里程碑意义的美国联邦法院判决裁定，人工智能公司Anthropic在未经许可的情况下使用受版权保护的书籍来训练其大语言模型Claude，构成“合理使用”，并未侵犯版权。然而，该判决同时指出，公司“中央图书馆”中存储盗版书籍的行为可能构成侵权，需另行审理。这一裁决为快速发展的AI产业在数据使用方面提供了初步法律界限，但也引发了关于创作者权益保护的深远讨论。

在人工智能技术飞速迭代的时代，数据，尤其是高质量的文本和图像数据，是驱动其能力边界拓展的核心燃料。然而，这些数据的来源和使用方式，尤其是当它们涉及既有知识产权时，一直是大模型开发者与内容创作者之间矛盾的焦点。近日，美国旧金山联邦法院对Anthropic公司的一项判决，为这场版权之争划定了一道初步但意义深远的界线，为AI训练数据的“合理使用”（fair use）原则提供了关键的法律解读。

判决核心与“合理使用”的边界

这项裁决源于作家Andrea Bartz、Charles Graeber和Kirk Wallace Johnson对Anthropic公司提起的诉讼。他们指控Anthropic在未经许可的情况下，利用他们的作品来训练其大型语言模型Claude，从而侵犯了版权。然而，联邦法官William Alsup在裁决中明确指出，Anthropic将这些书籍用于训练AI系统的行为，构成了版权法下的“合理使用”¹²。

这一判决的核心在于对“合理使用”原则的**“转换性”**（transformative）解读。法官认为，AI模型对原始作品的摄取并非简单的复制，而是将其作为训练数据，以生成新的、具有创造性的输出，这种使用是“极其具有转换性的”³。这意味着，AI从这些文本中学习语言模式、概念和风格，而非直接再现原作内容，其目的和性质与原始作品的创作和市场目的不同。

然而，判决并非全面豁免了Anthropic的法律责任。法官同时强调，尽管训练行为本身被认定为合理使用，但Anthropic“中央图书馆”中存储盗版书籍的行为，可能构成侵权¹。这一区分至关重要：它将AI训练的过程性使用（process-based use）与数据存储的合法性（legality of data storage）分离开来。前者被视为技术创新过程中的必要转换，后者则回归到传统的版权保护范畴。这意味着，即使AI公司被允许使用受版权保护的内容进行训练，它们也必须确保其用于训练的数据来源是合法的，例如通过许可或合法获取，而非盗版。

行业震荡与创作生态的未来

这项判决无疑给正面临类似版权诉讼的AI公司，如OpenAI、Meta、Google和Midjourney等，注入了一剂强心针²。长期以来，这些公司在数据获取上的“大胆”策略，一直饱受内容创作者的诟病。此次判决在一定程度上为AI模型的训练合法性提供了初步的法律依据，可能会影响未来针对AI公司的类似诉讼走向，并为整个AI产业在数据合规方面提供参考框架。

然而，对于作家、艺术家和出版商而言，这一裁决无疑是一个沉重打击²。许多创作者认为，AI公司未经许可使用其作品进行训练，等同于盗窃，是对知识产权的公然漠视。他们担心，若AI公司可以免费使用海量版权内容，将极大削弱原创作品的市场价值，甚至威胁到创作者的生计。BBC近期也威胁要对未经授权使用其内容进行训练的AI公司采取法律行动，这进一步凸显了版权方与AI企业之间日益紧张的关系³。

这种张力揭示了新兴技术与既有法律框架之间的根本性冲突。在传统版权法设计之初，并未预见到以如此规模和方式对人类知识进行“学习”的AI系统。判决虽然为AI产业的创新敞开了一扇门，但也同时将创作者的权益推向了前所未有的脆弱境地。如何平衡技术进步的必要性与创作者的合理回报，将是未来几年亟需解决的社会难题。

法律前沿的挑战与AI治理

Anthropic案被视为AI行业的一个“测试案例”⁴，其影响将远超Anthropic一家公司。这项判决是全球范围内AI版权诉讼浪潮中的一个早期里程碑，它为AI训练数据的合法性提供了一个重要的判例。但与此同时，它也凸显了在数字时代，尤其是在生成式AI蓬勃发展的背景下，版权法面临的巨大挑战。

未来的法律战线将更加复杂。除了“合理使用”的定义外，诸如AI模型输出内容是否构成侵权、模型训练数据来源的追溯与合规性、以及如何建立有效的许可机制等问题，都将成为法律界和政策制定者关注的焦点。例如，欧洲联盟的《人工智能法案》（AI Act）等全球各地的法规正在逐步成形，它们可能会在数据使用和透明度方面提出更严格的要求。

总而言之，Anthropic案的判决，只是AI与版权拉锯战的序章。它明确了“合理使用”在AI训练中的一定适用性，但也敲响了数据来源合法性的警钟。随着AI技术日益渗透社会经济的方方面面，法律、伦理和社会治理框架的同步发展，将是确保技术能够以负责任和可持续方式造福人类的关键。

引文

Anthropic did not breach copyright when training AI on books without permission, court rules·The Guardian·（2025/6/25）·检索日期2025/6/26 ↩︎ ↩︎
A federal judge sides with Anthropic in lawsuit over training AI on books without authors' permission·TechCrunch·（2025/6/24）·检索日期2025/6/26 ↩︎ ↩︎ ↩︎
US Judge sides with AI firm Anthropic over copyright issue·BBC News·（2025/6/24）·检索日期2025/6/26 ↩︎ ↩︎
Anthropic Wins Ruling on AI Training in Copyright Lawsuit but Must Face Trial Over Pirated Books·U.S. News & World Report·（2025/6/24）·检索日期2025/6/26 ↩︎