人工智能(AI)作为新一轮科技革命和产业革命的重要驱动力,目前已成为全球科技、经济以及宏观政策布局所关注的领域。算力、算法和数据作为人工智能产业发展的基础设施和生产要素,是决定人工智能产业实现高质量发展的重要保障。数据要素因包含了版权?;た吞?,引发了人工智能产业是否需要取得权利人授权并支付报酬的争论。如何在强化数据供给的过程中保障版权权利人的权益,是在促进人工智能产业发展过程中需要面对的问题。

数据要素包含版权?;た吞?/span>
人工智能模型训练需要海量的优质数据。数据集中除了自然人和法人的行为数据外,亦包含文字、图片、影视、音乐等受版权?;さ目吞濉U庑┛吞迨侨斯ぶ悄苣P脱盗泛陀锪峡饨ㄉ柚械墓丶砸兀捍?ldquo;量”的角度看,人工智能模型训练只有尽可能多地使用这些数据,才能提升模型运算的效率,为用户提供全面的信息;从“质”的角度看,人工智能模型训练的可靠性依赖高质量的优质数据,越是传播效率高的优质版权客体,越能提升人工智能模型生成结果的可靠性和准确性。由于版权?;た吞迥芄宦闳斯ぶ悄苣P脱盗范愿咧柿渴莸男枰?,因此成为了人工智能模型训练中的关键性生产资料。版权?;た吞灏ㄗ髌罚ㄎ淖?、音乐、美术等)和邻接权保护客体(录音录像制品、广播电视节目等)。在我国,自然人作品的保护期是作者终生及其死亡后五十年,邻接权?;た吞宓谋;て谠蚴鞘甑轿迨瓴坏取D壳安抵械奈淖稚扇砑?、图像生成软件、音乐生成软件、视频生成软件都需要以版权?;た吞遄魑盗肥萁星捌谘盗?。
模型训练存在侵权风险
版权包括发表权、署名权、修改权、?;ぷ髌吠暾ㄋ南钊松砣ǎ约案粗迫?、信息网络传播权、改编权、翻译权、汇编权等财产权。在人工智能模型训练的过程中,会涉及上述版权所包含的权项。依据我国现行著作权法,使用者的开发利用行为如涉及上述权项,除存在版权合理使用情形外,均需要取得权利人授权并支付报酬。从人工智能模型开发者的角度看,实践中其要么与权利人签订了商业利用版权保护客体的许可合同,要么通过技术手段从网上爬取所需要的数据或从第三方处购买所需要的数据使用权。在这一过程中,第三方是否有权许可他人使用版权客体用于模型训练在很多情况下存疑。此外,模型开发者是否能够将未经授权从网上爬取的数据用于模型训练也存在争议。
能够为使用行为提供豁免的合理使用制度,是众多未取得授权而使用版权保护客体进行模型训练的主体在面临版权侵权指控时所运用的抗辩理由。实践中,有一些国家的司法判决认为,大模型对作品的使用属于对作品独创性表达的非表达性使用,且数据训练只是对语料数据做结构性特征的分析,此种行为应当认定为合理使用。对该观点,我国学界和产业界持谨慎态度,相关行为是否属于合理使用的共识尚未形成。一方面,许多模型训练的开发者已经与高质量语料库的权利人签订了版权?;た吞宓氖菅盗肥褂眯砜尚?,如该观点成立,则意味着其前期基于语料库采购所形成的竞争优势将不复存在;另一方面,版权权利人也担心后续模型训练所生成的内容,会对其创作行为所反映的使用价值产生影响。此外,相关判决的说理忽视了人工智能模型训练需以对版权保护客体进行复制为前提。该复制行为因服务于后续产品开发和服务提供而具有独立的经济价值,因此属于对复制权的侵犯。
分类施策合理规制
从制度供给的角度看,各国立法者已经意识到了版权?;た吞逶谌斯ぶ悄苣P涂⒗弥械募壑狄约捌渲兴嬖诘奈侍?,已有立法者对本国的版权制度进行了调整与创新,以回应产业发展和权利保护需求。在尊重知识产权的前提下,以实现利益平衡为共识,是在版权制度框架下解决人工智能模型训练中版权问题的出发点。对此,结合版权制度已有的规范工具,针对不同人工智能模型对特定版权?;た吞宓囊览党潭群腿斯ぶ悄苣P捅旧淼挠猛?,分类施策应是未来合理的规制路径。
首先,应当充分挖掘合理使用的适用潜力,对特定主体通过人工智能技术、为满足特定目的使用版权?;た吞宓男形枰曰砻狻4右延杏蛲饬⒎ǖ慕嵌瓤?,该豁免所适用的领域,应在满足“三步检验法”的前提下确定。“三步检验法”作为国际领域确定版权合理使用的标准,《?;の难Ш鸵帐踝髌凡峁肌返诰盘醯诙疃源私辛斯娑?。其主要包括以下三个步骤。第一,合理使用只能在某些特殊情况下使用。对此,公约并没有具体规定哪些情况属于特殊情况,但根据各国立法,通常包括个人学习、研究或欣赏,介绍、评论某一作品或说明某一问题,报道时事新闻,学校课堂教学或科学研究中的翻译,图书馆的陈列、保存或其他非营利性目的等。第二,合理使用不得与作品的正常利用相冲突,即合理使用不能影响作品的正常市场或商业价值。例如,不能因为合理使用而导致作品的销售量下降或市场价值受损。第三,合理使用不得损害版权权利人的合法权益,即合理使用不能侵犯版权人的署名权、?;ぷ髌吠暾ǖ群戏ㄈㄒ妗?/span>
其次,应当引入新型法定许可制度,为特定场景下人工智能模型的开发者创造使用版权?;た吞宓那?。法定许可制度具有平衡产业主体利益的功能,在适用法定许可的场景下,使用人无需取得权利人的一对一授权,而只需要向权利人支付合理的报酬。在不少国家和地区,法定许可费用的支付及其标准的确定,多由著作权集体管理组织负责。著作权集体管理组织作为权利人和使用者之间的桥梁与纽带,具有保障权利人权益、平衡权利人与使用者利益、促进版权?;た吞甯咝Тビ肜玫墓δ?。著作权集体管理组织的运行受到专门性规范的调整(在我国为《著作权集体管理条例》),并接受市场监管部门和行业主管部门的监督。
此外,还应当保留版权权利人和人工智能模型训练开发者针对特定模型开发的协商许可机制,以针对某类具体版权?;た吞宓娜斯ぶ悄苡τ媒惺谌?。对此应当注意到,人工智能模型具有多样性的特点,如果某种人工智能模型对特定作品具有高度的依赖性,即其所生成的内容和原作品之间具有紧密的关联性,且能够再现原作品的独创性表达,则针对该场景下的人工智能模型训练就需要取得版权人和使用者的一对一授权,既不适用合理使用,也无法通过法定许可进行规制。