生成型AI藉由原始资料训练,进而有所产出,在这个过程中,是否会衍生智慧财产权的争议?这篇文章区分两个层次的问题:「输入」层次上使用原始资料是否经授权,以及「输出」层次上AI产出是否将与原作者竞争。
撰文|谢达文
生成型AI之所以强大,主要是因为他们「受过训练」,从数以亿计的原始资料中,找到这些资料的规律。而这样的「训练过程」,也衍生法律和伦理上的争端──这些原始资料的创作者,可以主张任何权利吗?用另一个方式说,AI公司没有经过我的同意,就拿我创作出来的东西,训练他们家的AI,甚至藉此获利,这样说得过去吗?
在美国,已经有些案子进到法院的审理程序,判决结果势必将影响日後AI的发展,而这方面的争端,又可以分成两个层次:「输入」与「输出」。
输入:我有同意你使用吗?
「输入」的层次,指的是「光凭我有提供训练资料,你是不是就应该尊重我的权利?」甚至「我是不是有权利拒绝你使用我的创作?」去年11月,在旧金山,有人向微软和GitHub提出集体诉讼,主要争议就围绕着这个问题(Brittain, 2023; Fried 2023; Roth 2023)。
有在写程式的读者,可能对GitHub都不陌生。GitHub是一个可以分享程式码的网页,上面有许多人免费分享自己写的指令,提供大家参考。虽说是开放免费使用,但指令本身仍受智慧财产权保护,有一些人在上传自己写的指令时,会写出引用的条件(也就是所谓的「授权条款」,英文称为license),比如虽然可以免费使用,但仍必须具名引用。「开源」(open source)社群的重要原则,就是创作者公开分享自己心血,而引用者也尊重授权条款的条件。
而微软和GitHub合作的新AI工具Copilot,可以「建议」使用者怎麽写指令。这个工具的研发过程,等於是先连上GitHub,把大家上传的指令都看过一次,用自己的方式「作笔记」,「学习」起来,之後就可以按照它「学到」的内容,提供使用者建议。
这样大规模的学习,算不算是引用?如果算,那微软和GitHub是否等於违反了原作者设定的授权条款?
类似的案子,还包含网路大图库Getty控告AI图片产生器Stable Diffusion,未经同意,就从图库上取用1千2百万张图做训练(Vincent, 2023a),以及CNN和《华尔街日报》控告ChatGPT背後的公司Open AI,同样未经同意,就用这些媒体的新闻报导内容来训练AI(Smith, 2023)。尤其Getty是透过「免费预览(但有浮水印),付费授权」营利的公司,问题因此也牵涉到,AI公司并没有付费,就使用了他们的内容。
微软和GitHub方面的答辩,主张原始创作者并没有真的受到伤害,因为微软并没有真的「使用」别人写的指令,只是从网路上搜寻得到的东西「学习」。这个说法,翻成白话文,就是说,微软认为自家AI没有「复制贴上」或「改写」任何东西,只是像个学生一样,上GitHub晃一晃,弄清楚程式怎麽写之後,产出自己的指令。这个答辩是否成立,就牵涉到在AI时代「使用」的定义究竟为何,对此,这个案子的诉讼才刚开始,法官会怎麽认定,还没有人能预测。
输出:你产出的东西在跟我抢钱!
微软等公司的第二个答辩,是即使这算「使用」,也算是智慧财产权法上的「合理使用」(fair use)。「合理使用」是智慧财产权法上相当复杂的一个概念,而且美国最高法院近期可能会推出新的判决,或许将大幅改写这个概念在美国法的意义。
不过,这个概念的基本原则很单纯,即使受智慧财产权保障的创作,仍然可以被合理使用,比如可以在教学时被引述,甚至有限度的重制(老师把一小段复制到课堂简报上)。而法院在考量一个案件是否属於「合理使用」时,经常会考量的因素,包含「使用的目的」,以及「成品在市场的影响」(Vincent, 2023b)。
而「成品在市场的影响」就涉及到第二个层次的问题──输出,也就是:「好,就算我让AI在训练时用我的创作,但AI弄出来的东西要跟我抢钱,我总可以主张我的权利了吧!」
关於这个问题,目前最具指标性的案件,是一位艺术家Hollie Mengert的经历(Baio, 2022)。她是一位插画家,与迪士尼、企鹅(美国的大出版社)都有合作。有一天,她突然发现,有人用了她的作品,训练AI工具Stable Diffusion,让AI工具可以产出「Hollie Mengert风格的画作」。
这里仍有先前第一个层次的问题,Hollie Mengert并未授权任何人使用她的图片训练AI工具(在这个案子中,她甚至无法授权,因为她的作品有许多已经卖断给迪士尼或企鹅)。
除此之外,这个案例还有第二个层面的问题,人们可能利用AI工具,创作出「Hollie Mengert风格」的作品,藉此营利,甚至直接Hollie Mengert竞争。也就是说,「成品在市场的影响」可能对原本的创作者不利,因此,法院就更有可能认定这不是「合理使用」。
小结以上概念,法院很可能会认为使用者用AI工具「画出一张卡通公主的图」不违法,但如果使用者特别要求AI工具「用某某创作者的风格,画出一张卡通公主的图」,甚至藉着创作出来的图片营利,被认定违法的风险就比较高了。虽然,这仍是很新的议题,美国、乃至其他国家的法院会怎麽认定,还有待後续观察。
参考资料:
- Brittan, Blake. 2023. “OpenAI, Microsoft want court to toss lawsuit accusing them of abusing open-source code.” Reuters.
https://www.reuters.com/legal/litigation/openai-microsoft-want-court-toss-lawsuit-accusing-them-abusing-open-source-code-2023-01-27/ - Fried, Ina. 2023. “Generative AI is a legal minefield.” Axios.
https://www.axios.com/2023/02/24/chatgpt-generative-ai-legal-minefield - Roth, Emma. 2023. “Microsoft, GitHub, and OpenAI ask court to throw out AI copyright lawsuit.” The Verge.
https://www.theverge.com/2023/1/28/23575919/microsoft-openai-github-dismiss-copilot-ai-copyright-lawsuit - Vincent, James. 2023. “Getty Images sues AI art generator Stable Diffusion in the US for copyright infringement.” The Verge.
https://www.theverge.com/2023/2/6/23587393/ai-art-copyright-lawsuit-getty-images-stable-diffusion - Vincent, James. 2023. “The scary truth about AI copyright is nobody knows what will happen next.” The Verge.
https://www.theverge.com/23444685/generative-ai-copyright-infringement-legal-fair-use-training-data - Baio, Andy. 2022. “Invasive Diffusion: How one unwilling illustrator found herself turned into an AI model.” WAXY.
https://waxy.org/2022/11/invasive-diffusion-how-one-unwilling-illustrator-found-herself-turned-into-an-ai-model/