美国法院裁定,人工智能公司Anthropic在训练其AI模型时使用受版权保护的书籍不构成侵权,判定此举属于法律上的“合理使用”。这一里程碑式的裁决为AI模型的开发与数据利用提供了重要法律指引,同时也在创作者社群中引发了关于数字时代版权保护与报酬机制的深刻讨论。
数字经济的疆界正在被生成式AI技术以前所未有的速度拓宽,而在这场技术革命的核心,数据的获取与合法性问题始终是悬而未决的达摩克利斯之剑。近日,美国一起备受瞩目的司法裁决,似乎暂时为AI产业卸下了这柄重担。美国法院裁定,AI公司Anthropic在训练其大型语言模型(LLM)时,使用受版权保护的书籍的行为,不构成对美国版权法的侵犯,而是被认定为“合理使用”(fair use)。12 这一判决,无疑为AI开发者们注入了一剂强心针,但同时也再次点燃了创作者社区对知识产权保护与AI技术发展之间矛盾的深层忧虑。
北加州联邦地区法院的威廉·阿尔苏普(William Alsup)法官在判决中指出,Anthropic对版权作品的利用是“极其具有变革性的”(exceedingly transformative)。34 这一表述是理解判决核心的关键。在版权法中,“合理使用”通常考虑四个因素:使用目的和性质(是否具有变革性是重要考量)、受版权保护作品的性质、所用部分的数量和实质性、以及对潜在市场或作品价值的影响。法官认为,AI模型学习书籍内容的目的是为了理解语言模式、语法和知识结构,而非复制或替代原始作品。这种“学习”过程被视为一种技术上的变革性使用,与传统意义上的抄袭或盗版存在本质区别。
判决的法律基石:何为“合理使用”?
此案的核心在于,大型语言模型如何“消化”和“利用”训练数据。LLM通过分析海量的文本数据(包括书籍、文章、网页等)来识别模式、学习语言的统计规律,并在此基础上生成新的、原创性的内容。Anthropic的律师辩称,他们的AI模型Claude并非简单地“复制”了这些书籍,而是将其作为“学习工具”来构建其内部的知识表征。法官认可了这一观点,认为AI模型在训练过程中对数据进行了深层次的抽象和重构,生成的结果并非原作的复刻,因此具备了“变革性”的特质。3
然而,判决也并非毫无限制。尽管法官支持了训练行为的合法性,但他同时也强调,这并不意味着AI公司可以免受法律约束。如果AI模型直接生成了构成版权侵权的内容,例如直接复制了受版权保护的文本片段,那么版权方仍有权追究其法律责任。换言之,判决划清了一条界线:模型训练过程中的数据摄取属于合理使用,但模型的最终输出仍需遵守版权法。 这一点对于理解AI技术与版权的未来交锋至关重要,它提醒AI开发者,创新并非完全的无主之地,输出层面的合规性依然是不可逾越的红线。3
产业生态的涟漪:机遇与挑战
这项裁决对于新兴的AI产业而言,无疑是一剂强效的催化剂。长期以来,AI公司在数据获取方面面临着巨大的法律不确定性,尤其是在使用大规模公开数据集进行训练时。这次判决的出现,可能将为AI企业扫清一部分法律障碍,降低其数据获取的合规成本和潜在的诉讼风险,从而加速大型模型的研发和部署。Anthropic作为OpenAI的主要竞争对手之一,其模型的进步和商业化进程将因此受益,这也可能促使整个行业在数据利用上采取更积极的策略。2
然而,这枚硬币还有另一面。对于作家、出版商和内容创作者而言,这一裁决无疑是令人沮丧的。他们认为,自己的作品是AI模型赖以“学习”的基础,但却未能获得相应的许可费或版税。Cnet指出,这一裁决对创作者而言是“坏消息”。4 尽管法官强调了“合法获取的书籍”这一前提,即Anthropic并非使用盗版书籍进行训练,但创作者依然担忧,他们的劳动成果在未经明确授权和付费的情况下被用于商业用途,这将侵蚀传统内容创作的经济基础。5 这引发了关于“数据正义”的深刻伦理问题:在AI时代,如何重新定义内容价值,并建立一个能公平分配收益的生态系统?
展望未来:AI伦理与知识产权的交汇点
此次判决很可能成为AI与知识产权领域的一个重要先例,但它绝非终点。相反,它更像是未来一系列复杂法律战役的序章。随着AI模型能力的不断提升,它们与人类创作内容的边界将变得更加模糊。例如,如果AI能够生成风格高度相似、甚至在某些层面上可以“替代”人类创作者的作品,那么“变革性使用”的定义是否需要重新审视?
未来,我们可能会看到以下趋势:
- 更多关于“AI产出物”的版权诉讼: 随着AI生成内容日益普及,关于其是否侵犯现有作品版权的争议会更多。
- 新颖的许可与报酬模式探索: 科技公司、内容创作者和版权机构可能被迫探索新的合作模式,例如建立集体许可机制或基于AI模型使用量的内容报酬体系。
- 立法层面的明确: 司法判例虽具指导意义,但国会或国际组织可能会出台更明确的立法,以适应AI时代知识产权保护的独特挑战,平衡创新与创作权益。
AI与知识产权的交汇点,不仅是法律和技术的博弈,更是对我们社会如何定义“创造力”、如何估量“劳动价值”的一次深刻反思。阿尔苏普法官的判决为AI的进步打开了一扇门,但也同时向我们抛出了一个根本性的问题:在人类智慧与机器智能共存的未来,我们该如何重新构建知识共享与价值创造的伦理与经济秩序?
引文
-
Judge backs AI firm over use of copyrighted books·BBC News·(2025/6/25)·检索日期2025/6/25 ↩︎
-
US judge backs using copyrighted books to train AI·TechXplore·(2025/6/25)·检索日期2025/6/25 ↩︎ ↩︎
-
Judge: AI Training on Books Is Fair Use, But Piracy Isn’t·National Law Review·(2025/6/25)·检索日期2025/6/25 ↩︎ ↩︎ ↩︎
-
Judge OKs Anthropic’s Use of Copyrighted Books in AI Training. That’s …·CNET·(2025/6/25)·检索日期2025/6/25 ↩︎ ↩︎
-
Key fair use ruling clarifies when books can be used for AI training·Ars Technica·(2025/6/25)·检索日期2025/6/25 ↩︎