赵婧等 | 生成式人工智能法律法规梳理与实务指引(一)——AI生成物的保护

赵婧等 | 生成式人工智能法律法规梳理与实务指引(一)——AI生成物的保护

作者 | 赵婧 沈琲 罗赓上海申浩律师事务所

目次

    一、生成式AI的工作原理二、人工智能生成物是否能够获得《著作权法》保护?三、人类如何拥抱生成式AI?四、我国“提示词”保护的思路的构想2023年7月,世界人工智能大会在上海如期举办,关于机器人、人工智能的新一轮话题热度又直线上升。AIGC(AI-Generated Content,人工智能生成物,此类型AI亦称为生成式AI)自2022年开始迎来了高速发展,不仅与金融、传媒、娱乐、医疗、工业等各行业进行结合,以低成本、高效率的方式满足海量个性化需求,与此同时也孕育着行业业态的新模式。而对AIGC的规制,美国版权局于今年3月发布了关于包含AI生成内容之作品版权登记的政策声明(Copyright Registration Guidance: Works Containing Material Generated by Artificial Intelligence),我国也相应出台了《互联网信息服务深度合成管理规定》与《生成式人工智能服务管理暂行办法》本专题将结合国际上的规制现状,国内的政策解读,对人工智能生成物是否能够获得版权保护,如何避免人工智能生成物侵权,以及人工智能所涉及的伦理问题等展开一系列探讨与实务操作指引。

一、生成式AI的工作原理

根据《中国AIGC产业全景报告》的定义,AIGC全称为AI-Generated Content,指基于预训练大模型、生成式对抗网络(GAN)等人工智能技术,通过已有数据寻找规律,并通过释放泛化能力生成相关内容的技术。在我们阐释AIGC可能涉及的法律争议之前,先来看看预训练大模型和生成式对抗网络的含义。预训练大模型(LLM),包含了“预训练”-“指令微调”两个步骤。第一步在大规模无标注数据(如互联网文本)上进行模型预训练,学习通用的语言模式;第二步在给定自然语言处理任务的小规模有标注数据上进行模型微调,快速提升模型完成这些任务的能力,最终形成可部署应用的模型。[1]生成式对抗网络,则是由生成器和判别器组成的深度学习模型。生成器主要用以生成和真实数据近似的数据,而判别器主要用于区分生成器生成的数据和真实数据。生成器和判别器共同构成了一个动态的“博弈过程”。我们以时下热门的图像生成式AI及文本生成式AI详细解释。图像生成式AI是指基于给定文本描述,生成图像的AI系统(Text-To-Image,又称T2I)。这受益于计算机视觉行业的进展与深度生成网络研究的突飞猛进。目前扩散模型(Diffusion Model)因操作简便、生成图像精度高而成为最流行的生成模型。这一类的典型代表有Stable Diffusion、Midjourney。早期的模型是通过对图像元素添加关键词,再让指令词与图像信息进行匹配,以此达到用户输入文本,AI输出对应元素拼贴的效果。而扩散模型则在此基础上改良,通过对图片添加噪声(noise),再以计算机神经网络的正向加噪、反向去噪声过程生成质量更高和创造性更强的图像。通过大量的学习训练,AI就能从足够多的素材中学习并生成最接近人类真实世界中的数据。我们再来看文本生成式AI。时下最火的产品莫过于ChatGPT4。开头我们说过预训练大模型(LLM)包含了“预训练”和“微调”的两段式练习,其实GPT在前两代的时候并没有展现出优于其他模型的性能,而到GPT3的时候,突破性地在两段式的基础上加入了in-context学习方式,通过给模型做示范,让模型感知应该输出什么,而不是直接标记最优答案。GPT3通过引导式的学习方式,在超大模型上展现出了惊人的效果:只需要给出一个或者几个示范样例,模型就能照猫画虎地给出正确答案。而GPT4在底层技术原理上并没有超越第三代,而是改变了训练策略,通过人工筛选,不断判断输出的哪些句子是好的,哪些是低质量的,这样就可以训练得到一个reward模型。通过reward模型来模拟人类打分的过程,自动对问题的不同回答打分,模型再根据打分调整参数。即用问题、回答和分值作为数据,用强化学习的方式训练模型。这就是Chat GPT可以模拟情景对话、给出多元化答案,并在和人类的对话中可以不断修正结果的原理。通过对上述生成式AI工作原理的阐述,我们不难发现,AI的学习离不开海量的数据源,而数据来源真实性直接影响了AI输出结果的准确性,而数据源的合法性则可能直接导致对版权、隐私和伦理的争议。而对于AI输出的结果是否能成为法律保护的对象,又是否可能侵害他人的权利,也成为AIGC法律合规的焦点。

二、人工智能生成物是否能够获得《著作权法》保护?

今年3月美国版权局推出了关于生成式AI作品版权的政策声明。在这份声明中,对“生成式AI的生成的材料”和“由人类创作的(human-authored)和人工智能生成材料(AI-generated material)组成的作品”进行了区分。首先该份声明依然坚持了一项基本原则——版权法只能保护“人”的智力创造。因此,由计算机算法自主创建的生成物是无法被认定为“作品”的。而在今年2月,一份由人类作者创作文本、Midjourney生成图像的图画小说Zarya of the Dawn,却得到了美国版权局的认可,被认为构成版权法保护的作品,获得了有限的保护。对此,美国版权局进一步解释,该图画小说中人类创作的文本属于人类的智力成果,符合版权法保护的标准,可以单独登记成为作品;而Midjourney生成的图像,仅仅是基于计算机算法得出的材料,无法独立获得保护,但不影响整个图画小说成为一个完整的作品。那么对于由人类使用生成式AI进行多次调整、修改后的作品是否能够保护呢?在此问题上,该份声明举例了人类使用Photoshop编辑图像的例子。视觉艺术家利用图像编辑软件修改图片,计算机仅仅是一种辅助工具,它不影响人类对作品表达的创作性控制,因而不会影响图片艺术家的“作者”身份。相反,对于由机器自动运行,没有人类作者的任何创意或干预而产生的作品则无法获得保护。而关于在人工智能训练中使用受版权保护的作品在法律上应当如何规制等问题,美国版权局后续也将向社会公众征求意见。因此我们看到了一个有意思的现象,美国版权局没有一刀切地认为只要是AI生成的作品就不是“作品”,而是需要进行个案分析。虽然如何判定人类在作品中的智力贡献,以及是否能够在单件作品中独立区分开人类创作部分和AI创作的部分,是一件在实际操作中并不容易的事情。但至少,该份声明明确了,版权法依然应当以人为本,也奠定了生成式AI应当服务于人类,成为人类工具的基调。而英国在作品的创造性问题方面,则一直主张“额头流汗”原则,即只要作品中存在作者的劳动即可,而无论此项劳动的多少。英国《1988年版权、设计与专利法》明确认可文学、戏剧、音乐或艺术作品如果是由计算机产生的,那么这一作品的作者应当是对该作品的创作进行必要安排的人,此类由计算机生成作品的著作权保护期限系自作品创作完成当年的最后一天起五十年,同时对于此类作品不适用著作人格权。[2]目前,我国现行出台文件均没有对AI生成物是否符合《著作权》法意义上的作品给出结论性评价。而在国内现有的案例中,对于AI生成的作品是否是“作品”也形成了完全相反的观点。让我们先回归法条,我国《著作权法》中所称的作品,“是指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果”,所以作品具有两个实质构成要件:“独创性”和内容属于“智力成果”。那么这里的“智力成果”是否必须为人类的智力成果呢?我们从(2019)粤0305民初14010号“Dreamwrite”案件中可以看出一些判断方向。深圳南山区法院认可了由Dreamwriter软件自动撰写完成的文章可以被认定“作品”,但其在说理部分强调了Dreamwriter软件的自动运行并非无缘无故或具有自我意识,其自动运行的方式体现了原告的选择,也是由Dreamwriter软件这一技术本身的特性所决定……从涉案文章的生成过程来分析,该文章的表现形式是由原告主创团队相关人员个性化的安排与选择所决定的,其表现形式并非唯一,具有一定的独创性。其观点是,人工智能生成内容基于人工智能的控制人或研发人员设置一定的技术、算法而得,其在一定程度上仍属于人类的智力成果。但同时可见,我国法院在判断AI生成物是否是作品的过程中,仍不可排除地需要甄别“人”在作品中的地位和作用。然而随着深度学习技术和大数据等网络技术的飞速发展,人工智能早已摆脱了遵循既定算法和程序的计算机辅助工具的地位,能够独立自主创作。这种自主创作的方式将可能使人对作品的控制性创造作用越来越小。因而,笔者认为,美国版权局的甄别方法或对我国AI生成物的保护具有一定的借鉴和参考意义。当然,我国《著作权法》虽暂无定论,却不妨碍生成式AI的提供者通过与用户订立协议的形式约定生成物的著作权归属。

三、人类如何拥抱生成式AI?

生成式AI给人类带来的冲击感毫无疑问是强烈的,甚至对一些职业造成了现实的威胁,比如游戏制图、影视美术、工业设计等领域,AI看上去稍加训练便可以替代,想象力甚至超越人类。但通过上文对AI原理的分析,我们也可以清醒地认识到,AI虽然具备了深度学习的能力,但仍在模拟人类进行思考,也需要通过人类来甄别一些信息。比如文本生成型AI,当我们需要一个专业领域的LLM时,用于预训练模型中的知识库就显得尤为重要。由于大多数预训练模型都是在通用训练语料上进行学习的,对于一些类似金融、法律等特殊领域中的概念和名词,AI都无法具备很好的理解。所以需要在训练语料中加入一些领域数据,以帮助模型在指定领域内获得更好的效果。这就给了专业领域的人才以新的合作机遇,而未来,训练完成的AI将可能有针对性地适配在各个专业领域内,成为能提高人类效率的良好工具。而图片生成式AI的新赛道则展露的更早,美国早已出现了售卖提示词的网站。在AI的世界里,提示词(Prompt)就是和AI沟通语言的桥梁,通过准确的使用关键词,才能让AI生成出自己想要的、具有稳定风格的作品。而那些能让AI做人类想要让他们去做的事情的专家被称为提示词工程师(Prompt Engineer)

四、我国“提示词”保护的思路的构想

目前国内外,已有很多使用大模型进行生产创作的实践应用,涉及软件开发、文本处理、图像生成等多个领域,而“如何写出好的提示词”正在成为各个领域热论的议题。接踵而来的,即是优秀的提示词如何能够保护?我们首先来分析其是否能够通过《著作权法》进行保护。一些由词组、短句堆砌而成的较为简单的提示词,由于其本身不能联系成为一个语义连贯,具有独创性意义的作品,因而不属于著作权法保护的对象。而如将古诗词“横看成岭侧成峰,远近高低各不同”作为提示词,亦无法获得保护,因为该作品已属于公有领域,同样不符合保护条件。由此来看,提示词想要获得《著作权法》保护,则可能需要进行非常详细的描述,同时又要具备独创性的特征。如果要求提示词工程师一定要达成上述条件,其智力成果才能获得保护,确实是有些强人所难,更有些强AI所难,因为AI的本质系一系列计算机程序的组合,其善于接受的指令通常应当是简洁、简短、明确的词语或短句,并不需要过多的修饰或完整连贯的意思表示。但一段好的提示词的确需要工程师进行反复的推敲、实验、修改,同时也需要工程师具有一定的计算机软件编程知识或至少应当初步了解其所被提示的AI的基本工作或运作原理,要付出非常极大的努力,不可否认一段优秀的提示词应当被认定是智力成果。那么,在提示词本身的基本表达不能被著作权保护的情况下,是否有更好的保护方式呢?笔者认为,在没有新的法律法规制定和颁布之前,我们可以在现有知识产权法律法规框架体系中寻找适合的方式,首先,提示词的排列组合方式可以被定义为一种方法,而方法是可以通过发明专利进行保护的,简单以绘画类AI举例,当我们需要使用提示词通过绘画类AI生产作品时,提示词通常至少会包含需要绘画的物品、物品的色调、整体绘画的风格,如包含人物肖像,亦需要人物肖像的特征,人物的情绪定义等,对于这么多关键信息,我们采用不同的排列方式将会得到AI生成的不同表达的作品,例如先体定义总体风格并嵌套色调、先定义情绪再嵌套肖像特征与先定义色调、肖像特征最后定义风格和情绪将获得不同的作品,这种方式即方法如具有一定的新颖性和创造性,是可以尝试申请发明专利并获得发明专利的保护的。当然,通过发明专利保护的劣势也非常明显,即一件发明专利的审查期限至少需要12个月,甚至更久,对于提示词规则的生命周期而言,保护是否会滞后可能是需要进一步考量问题;其次,我们来看提示词的本质,即一些具有明确含义的字、词、短语或短句(下文我们称之为“提示词元素”),其中明确的含义一般是指没有歧义,只有准确表达,让AI准确领悟提示人的意图,才能更有效地创作AI生成物(作品),从这一特性我们可以基本断言有效且优秀的提示词元素是有限的,例如可以有效提示肖像的提示词元素是这几个、有效提示情绪的是那几个、有效提示风格的是这一系列、有效提示运动状态是那一系列。这样大家是否想到,或者已经有非常多的企业已经在做的一个工作就是收集并汇总各个领域有效且优秀的提示词元素,并将其分类梳理为数据库,而“数据库”是我国著作权法明确保护的作品客体。所以,即便实际应用的某一段提示词不构成著作权法意义上的作品而不能获得保护,但可以考虑对提示词的分类组合的数据库进行确权和保护,而其关键点可能在于提示词的分类即数据库的字段设置,具体我们将另外行文分析。AIGC可以说是一项最接近普通人的AI运用,它使得AI不再那么高不可攀,只要一台联网的终端,人人都可以通过向AI发出指令的方式进行创作,并得到AI创作物(AIGC)。AIGC让人们体会到了AI的强大、便捷和效率,即便是在当下生成式AI实际应用发展的初期,其已经能为个人、企业解决非常多棘手的、繁杂的问题,其迅速热门也就不足为奇。由此接踵而来的当然是各种法律问题,无论是AI服务的提供者、AI服务的运用者、AI生成的作品的阅读者都会想要了解自己在提供服务、使用服务、浏览作品时应当符合的法律规范,笔者的系列文章意在通过探讨分析我国以及世界相关法律法规并结合自身通过分析得出一些粗浅结论让大家更好地了解AI相关法律问题,并希望能拓宽大家的视野,为大家在AI领域的运用提供灵感。下一篇文章,我们将着重探讨我国对于生成式AI的态度以及相关管理规定的解读,AI生成物如何避免侵权等问题。

注释(上下滑动阅览)

【1】 《大规模预训练模型》,《中国计算机学会通讯》2021年5月第5期,P8【2】 [ 唐蕾.人工智能生成物的著作权保护比较法研究——以元宇宙背景为视角[J].电子知识产权,2023,No.376(03):81-90.]参考文献【1】《大规模预训练模型》,《中国计算机学会通讯》2021年5月第5期【2】《一文读懂ChatGPT模型原理》JioNLP团队知乎【3】ChatGPT的工作原理:机器人背后的模型,36氪,百度赵婧专栏文章SPECIAL COLUMN

赵婧 罗庚 | 从郑渊洁案看“在先权利”保护的边界

虚拟偶像法律问题研究:虚拟偶像著作权及人格权问题探讨

法律视角解构NFT

赵婧等 | 生成式人工智能法律法规梳理与实务指引(一)——AI生成物的保护

作者:赵婧 罗赓 沈琲

编辑:Sharon

赵婧等 | 生成式人工智能法律法规梳理与实务指引(一)——AI生成物的保护赵婧等 | 生成式人工智能法律法规梳理与实务指引(一)——AI生成物的保护赵婧等 | 生成式人工智能法律法规梳理与实务指引(一)——AI生成物的保护赵婧等 | 生成式人工智能法律法规梳理与实务指引(一)——AI生成物的保护

点击图片查看文章

赵婧等 | 生成式人工智能法律法规梳理与实务指引(一)——AI生成物的保护

(www.pharmaip.cn)

赵婧等 | 生成式人工智能法律法规梳理与实务指引(一)——AI生成物的保护

(www.meddeviceip.com)

赵婧等 | 生成式人工智能法律法规梳理与实务指引(一)——AI生成物的保护

赵婧等 | 生成式人工智能法律法规梳理与实务指引(一)——AI生成物的保护