TL;DR:
当AI大模型忙着“吞噬”海量数据学习进化时,被“喂”进AI的图书、音乐、电影创作者们却炸锅了:这哪是学习,分明是明目张胆的“偷窃”!全球版权界为此吵翻天,从训练数据合法性到AI生成作品归属,简直是一团乱麻,这场版权“罗生门”,正考验着人类的智慧和法律的底线。
最近,科技圈的“大模型”们可真是风头无两,从写诗作画到代码编程,样样精通,让不少“打工人”直呼“饭碗不保”。然而,这些“AI卷王”们的成长史,却被曝出了一个“不太光彩”的秘密:它们训练用的“教科书”,可能压根就没给作者付过费,属于“拿来主义”的典范!
用《卫报》两位大咖安娜·芬德和茱莉亚·鲍尔斯的话说,这根本就是一场“明目张胆的犯罪行为”——“科技大佬们(tech bros)批发式、未经授权地占用了所有能数字化的书籍、艺术作品和表演作品”[^1]。好家伙,这不就是科技界的“梁上君子”吗?而且这俩姐妹还特别耿直,直接点名这操作“不仅损害我们的文化,甚至会不可逆转地削弱我们的民主”。这话一出,版权界的“吃瓜群众”们坐不住了,纷纷表示要为自己的“精神食粮”讨个说法。
喂数据:AI这孩子到底算不算“偷吃”?
想象一下,你辛辛苦苦写了本书,谱了支曲,结果AI扭头就“学”走了你的精髓,然后生成出无数个“似是而非”的新作品,你却一分钱都拿不到,这滋味,是不是有点像被人“白嫖”了?
这正是AI训练数据引发的核心争议。大模型要变得聪明,就得“吃”海量数据。这些数据就像是AI的“饭”,吃的越多、越杂,AI就越能理解世界、创造内容。但问题来了,这些“饭”里,可有不少是受《著作权法》保护的“私人定制”作品啊!
君合律所就曾指出,“利用海量数据训练人工智能模型过程中,难以避免使用到他人享有版权的作品作为训练素材。”[^2]
这些“偷吃”行为,可能直接侵犯了原作者的复制权、改编权甚至信息网络传播权。比如,AI在训练时,把你的作品复制到自己的数据库里,这算不算复制?学习你的作品风格,算不算改编?这就像一个学霸,考试前把你所有笔记都复印了一遍,还把你的解题思路融会贯通,考试得了高分,你却只能干瞪眼。
- “合理使用”这块“免死金牌”还好不好使?
AI公司也不是没有自己的“辩词”。他们常常会搬出“合理使用”或“非表达性使用”来给自己“洗白”。意思是:我只是拿你的数据学习了一下模式和规律,又没直接拿去卖,这跟人类学习一样,属于合理使用嘛!而且,如果非要逐一授权,那AI技术发展岂不是要被“卡脖子”?
然而,这块“免死金牌”在AI语境下,可没那么好用。传统意义上的“合理使用”通常有严格限制,比如非商业目的、对原作品市场影响小等[^2]。但AI训练往往涉及大规模商业应用,并且确实可能对原作品市场产生冲击。
北京大学法学院教授张平就提到,AI学习模仿人类创作模式,“很容易瞬间学习到他人的创作思想和风格,然后输出表达完全不同而风格极其相似的结果。”她直指,“传统上‘接触+相似’的侵权判断标准不再‘灵验’。”[^4]
这简直就是给传统著作权法来了一次“灵魂拷问”——当AI可以瞬间“学完”人类社会海量思想和风格时,“思想—表达二分法”这把尺子,还能不能准确丈量侵权边界?
- 大佬们的新玩法:从“偷吃”到“合作共赢”?
当然,也不是所有AI公司都等着被告上法庭。一些头部企业已经开始探索“曲线救国”的商业合作模式。比如Perplexity AI公司搞了个“出版商计划”,承诺引入合作伙伴版权数据的同时,会“反哺收入分成及提供必要的技术支持”[^2]。还有“数据集提供商联盟(DPA)”这样的组织,也在尝试建立符合著作权法的AI版权数据开发利用标准。看来,这AI界的“盗梦空间”,也开始考虑给“被梦者”分点蛋糕了。
AI“生娃”:版权这锅,谁来背?
AI不仅能“学”,还能“生”!文生图、文生文、文生视频……这些AI生成的作品(AIGC)让人惊叹,但新的问题又来了:这些“AI娃”的版权,到底该算谁的?是提供提示词的“奶爸奶妈”(用户),还是设计AI的“造物主”(开发者),还是……AI自己?
这个问题在全球范围内都是个“薛定谔的猫”——没打开盒子(没碰到具体案例),你永远不知道答案是什么。
- 中国:人类“参与度”是关键,用户优先?
在咱们中国,法院的态度相对“开明”。在一些AI绘画著作权案中,比如著名的“春风送来了温柔”案,法院就认定AI生成的图片具有独创性,属于著作权法保护的美术作品,并把著作权判给了提供提示词、调整参数的用户[^3]。理由是,虽然是AI画的,但用户在构思、关键词调整、风格设定等方面有“智力投入”,这可不是简单的“机械劳动”。这相当于给AI创作设定了一个“人类参与度”的门槛:只要你有投入,这“娃”就算你的。
- 美国:没人类作者,版权免谈?
美国的态度就比较“硬核”了,坚持“人类作者原则”。美国版权局多次强调,作品必须由人类创作才能受到保护。在著名的Thaler诉美国版权局案中,一个AI开发者试图将AI生成的图像注册版权,结果被版权局以“缺乏人类作者”为由直接驳回[^3]。甚至连含有AI插画的漫画《Zarya of the Dawn》,其AI生成的插画部分也无法获得版权,因为“提交文字指令并不能使用户对AI实际生成的图像拥有作者地位”[^3]。这意思就是:AI是你工具,但它不能做你“替身”,版权这事儿,没人类签字可不行!
- 欧洲:保守派的“数据生产者权”幻想?
欧盟这边,也坚持作品要体现“作者自身的智力创造”,纯AI生成的作品,版权基本没戏。他们曾设想过一个“数据生产者权”,想给那些机器生成的数据一种新的财产权,防止被别人“白嫖”[^3]。但这个想法最终也没落地,因为大家觉得这可能会过度限制数据自由,反而阻碍AI发展。
北大教授张平对此总结得好:“当前以事前授权为基础的著作权制度难以满足生成式人工智能对海量数据的训练需要,因而有必要使用多种制度工具,建立多元化的解决机制。”[^4]
看来,AI“生娃”的版权难题,真是考验全球法律人的“脑洞”和“平衡术”啊!
破局之道:AI与人类,还能不能“好好玩耍”?
面对这团乱麻,难道我们只能眼睁睁看着“偷窃”和“白嫖”横行,或者让AI创新被版权的“紧箍咒”困住吗?当然不!全球的法律界、科技界都在积极寻求解决方案。
- 立法:给AI作品一个“名分”
最直接的办法就是修法,给AI生成内容一个明确的法律地位。中国司法实践已经迈出了第一步,但还需要更细化的规则。可以参考英国的做法,对于“无人类作者”的计算机生成作品,把版权归给“进行创造所需安排的人”[^3],并适当缩短保护期。这样既能填补法律空白,又能激励创新。
- 行业自律与标准:AI界的“江湖规矩”
除了法律,行业自律也至关重要。可以建立一个AI创作内容的备案和授权平台,给AI生成作品打上“身份证”,方便追踪溯源、授权交易[^3]。就像君合律所提到的Perplexity AI和DPA,都是在尝试建立这种“合作共赢”的模式。
“AI平台可与相关数据供应商进行积极合作,部分人工智能行业头部企业正采取更为高效的合作方式以应对尚不明晰的人工智能训练数据规制情况。”[^2]
- 集体管理组织:版权“大管家”上线?
传统的著作权集体管理组织(比如音著协、文著协)或许能发挥更大的作用。它们可以作为“大管家”,代表海量创作者与AI开发者进行集中授权谈判,大大降低交易成本[^4]。当然,这些老牌组织也得“卷起来”,授权模式得更灵活,定价得更市场化,才能吸引更多创作者加入。
- 开放授权:共享精神的复兴?
知识共享协议(CC许可协议)提供了一个思路:创作者可以主动选择开放作品的使用权限,比如允许非商业使用,但要求署名[^4]。这在AI训练中能大大扩充合法数据源,推动共享。
- “避风港”规则:给AI开发者一点“安全感”?
借鉴互联网时代的“避风港规则”,对于AI开发者而言,如果他们尽到了足够的审查义务,并且在接到侵权投诉后及时采取措施,是否可以减轻或免除部分责任?这能给那些积极合规的AI企业吃颗“定心丸”,鼓励他们主动防范风险[^4]。
这场关于AI版权的“大乱斗”,其实是技术进步与传统法律体系的一次正面“硬刚”。未来,我们需要的不是一刀切的禁令,也不是完全放任的自由,而是一套既能保护创作者权益,又能激励AI创新发展的“新秩序”。毕竟,谁也不想自己辛苦“搬砖”的成果,被某个“赛博怪兽”不声不响地“打包带走”吧?人类与AI,这场“相爱相杀”的大戏,还在精彩上演呢。