AI要“恰饭”,版权人要“爆金币”:澳洲这出“数据盗窃”大戏,咋回事儿?

温故智新AIGC实验室

TL;DR:

澳大利亚最近炸锅了,艺术和媒体圈大声疾呼:AI再这么“白嫖”我们的内容去训练,就是“明抢”!政府想搞“数据挖掘豁免”,结果激怒了创作者,这下AI和版权人的“饭碗之争”彻底摆上了台面,全球都在看这出“罗生门”。

要说最近科技圈和文化圈哪块儿“瓜”最甜,那必须是AI和版权的那些事儿。这不,南半球的澳大利亚突然“冲上热搜”,一群艺术、创意和媒体机构集体“炮轰”政府:别想着给AI开绿灯,“白嫖”我们的内容去训练模型!这简直就是“明目张胆的盗窃”,要“卖掉”澳大利亚打工人的灵魂和知识产权!

AI要“吃”饭,谁来“买单”?——澳洲版权战火升级

事情是这样的,澳大利亚生产力委员会最近搞了个报告,里面提了个“骚操作”:考虑对“文本和数据挖掘”(Text and Data Mining,简称TDM)搞个豁免权,甚至想扩大“合理使用”规则的范围。这话一出,那可真是“一石激起千层浪”,直接点燃了内容创作者们的“怒火”。

你想啊,AI模型训练,那可是个数据狂魔,得“吃”海量的内容才能变得聪明伶俐。从文字、图片到音乐、视频,无所不“吃”。过去这事儿大多是“暗戳戳”地进行,大家心照不宣。现在,官方报告直接把这事儿摆到台面上,还想合法化“免费吃”,那可不得“破防”吗?艺术家、记者们集体“喊话”:我们辛辛苦苦码的字、画的画,凭啥就成了AI免费的“饲料”?这哪是技术创新,这分明是“变相偷盗”!1

好在,澳大利亚的阿尔巴尼斯政府出来“灭火”了,表示目前“没有计划”修改版权法。但他们也“含糊其辞”地补了一句,任何变化都“必须考虑”艺术家和新闻媒体的利益。而反对党领袖苏珊·利(Sussan Ley)的态度则“硬气”得多,直接“拍桌子”要求:未经补偿,版权材料坚决不能用2 这场关于“吃相”的争议,俨然成了澳大利亚政界、业界、创作界的一场“大乱斗”。

核心交锋:TDM与“合理使用”的罗生门

“文本和数据挖掘”(TDM)和“合理使用”(Fair Dealing/Use)这两个词儿,听着有点儿“高大上”,其实就是这场版权纠纷的“核心C位”。

简单来说,TDM就是AI模型为了学习人类知识和模式,对海量文本和数据进行自动化分析和提取的过程。它不像传统的阅读,更多是为了机器训练,而非人类直接消费。而“合理使用”呢,则是版权法里一个很重要的“例外”,允许在特定情况下,比如研究、评论、教学等,可以未经许可使用受版权保护的作品。

现在的问题是,AI训练这种“机器阅读”行为,到底算不算传统意义上的“合理使用”范畴?如果一锤定音“算”,那AI公司就有了“合法白嫖”的尚方宝剑;如果“不算”,那就意味着每次训练都得去“买授权、付真金白银”,这成本可就“上天”了。创作方坚持认为,AI的“学习”行为最终是为了生成新的、有商业价值的内容,这本质上就是商业利用,必须付费。用个不太恰当的比喻,你不能说你上厨师学校学习是为了“个人成长”,就随便拿米其林餐厅的食谱去开店吧?

“一方面,仍应鼓励AI平台采取合法渠道购买,取得合法授权的方式获取训练数据,对明确标明版权出处的作品应主动获取授权或支付报酬,增强数据及版权合规意识。” —— 这话的意思是,AI大佬们,该掏钱就掏钱,别老想着“薅羊毛”!1

这场争论,其实是“技术大跃进”和“传统规则”之间的一次“亲密碰撞”。既要鼓励AI创新,也不能让创作者“颗粒无收”,这平衡点到底在哪里,着实让各国政府和法律界“挠头”。

全球视野:别的国家怎么“玩”的?

澳洲这波“版权骚乱”可不是个例,放眼全球,AI版权问题早就成了各国“头疼”的“世纪难题”。

  • 美国:法院已经有先例了。比如,美国就有过法律信息公司Ross Intelligence和汤森路透之间的AI训练侵权诉讼,这可是AI训练数据版权争议的“标志性案件”,让AI公司们捏了一把汗。3 判决结果嘛,直接影响了AI行业对训练数据合规性的看法。
  • 欧盟:人家《人工智能法案》(EU AI Act)可是走在了前面,明确提出了“选择退出机制”(Opt-Out)。啥意思呢?就是创作者可以明确声明自己的作品“禁止用于AI训练”。这就像给创作者发了个“免战牌”,你AI再厉害,也得看我乐不乐意被你“吃”。4 这无疑为版权方提供了法律保障,也为AI公司划定了“边界线”。

你看,无论是鼓励AI平台“合法购买”训练数据,主动获取授权和支付报酬1,还是完善法律法规明确AI生成内容的可版权性、权利归属及侵权认定标准5,全球都在努力寻找那个“黄金平衡点”。这场关于AI训练数据版权的全球“拉锯战”,才刚刚开始。

未来展望:这盘棋该怎么下?

AI发展的大潮“势不可挡”,但如何让这股浪潮在尊重知识产权、保护创作者利益的前提下“高歌猛进”,是个大哉问。

对于内容创作者来说,这不仅是“饭碗保卫战”,更是对自身价值的“正名之战”。他们需要更明确的法律保障,确保自己的劳动成果不会被AI“免费打工”。

对于AI公司而言,这也不是一句“技术创新”就能“高枕无忧”的。构建合规的训练数据获取渠道,与内容方建立“互利共赢”的合作模式,是长远发展的必由之路。毕竟,谁也不想自己的AI模型哪天因为“吃错了东西”而惹上官司,对吧?

而各国政府和立法者,则肩负着搭建“新规则”的重任。这盘棋,需要精妙的平衡术:既要为AI创新留下“广阔天地”,又要守住知识产权的“底线”。或许,“选择退出机制”会成为一个重要的方向,或者建立更完善的“集体许可”或“强制许可”制度,让AI“恰饭”有规矩可循,让版权人“爆金币”有法律依据。

总之,这场AI与版权的“爱恨情仇”,远未到结局。我们拭目以待,看澳大利亚这出“大戏”最终会演变成“皆大欢喜”的多赢,还是“一地鸡毛”的乱局。但可以肯定的是,全球的目光都聚焦于此,因为这不仅仅是澳洲的事儿,更是关乎所有内容创作者和AI未来的“世纪之问”。

引用


  1. 人工智能训练数据的版权争议及合规方案·君合(2025/04/21)·检索日期2025/8/6 ↩︎ ↩︎ ↩︎

  2. Arts and media groups demand Labor take a stand against ‘rampant theft’ of Australian content to train AI·The Guardian·未知作者(2025/8/6)·检索日期2025/8/6 ↩︎

  3. 美法院首度裁定AI训练侵权,汤森路透胜诉背后全球版权保护的不同路径·复旦发展研究院(未知日期)·检索日期2025/8/6 ↩︎

  4. 浅析AI训练数据中著作权人的选择退出(Opt-Out)机制·金杜律师事务所(2024/7)·检索日期2025/8/6 ↩︎

  5. 生成式人工智能的著作权挑战与合规框架构建..·海润天睿律师事务所(2025/04/21)·检索日期2025/8/6 ↩︎