AI大模型背后的“专业人士”:网帮云笔
AI律师助手

AI大模型背后的“专业人士”:网帮云笔

AI大模型如ChatGPT、百度文心一言、讯飞星火认知成为网络热点,但其应用过程中存在用户痛点。为解决此问题,AI文创平台“网帮云笔”应运而生,其通过130万个专业领域,帮助用户准确描述需求,并提供对应的专业领域,让AI大模型生成满意的结果。该平台通过AI专家推荐功能,为用户轻松定义大模型的角色,实现了复杂文案创作的参数化,让用户以填写参数的方式完成需求,提高了创作效率。同时,其AI专家写手拥有130万个细分专业领域设定,使得用户可以秒变AI大模型应用达人。此外,该平台还具有热点拟稿功能,帮助用户实时跟踪网络热点,并让AI选出最佳三个热点,以此主题进行创作。总的来说,“网帮云笔”是一个集文案创作、编辑、协同、存储于一体的云办公系统,有效解决了用户在应用AI大模型过程中的痛点。
AI技术赋能未来:腾讯、美图、华为、阿里、百度、科大讯飞等企业布局解析
AI情感助手

AI技术赋能未来:腾讯、美图、华为、阿里、百度、科大讯飞等企业布局解析

本文介绍了多家科技公司正在研发的AI模型及其应用。腾讯混元大模型已进入应用内测阶段,美的 visual 大模型已迭代至1.5 版本,应用于多款产品。百度智能云千帆大模型平台升级,接入了33个大模型。阿里云通义千问模型已上线,并在魔搭社区开源。同时,一些 AI 相关应用因涉嫌违反苹果应用商店规定而被下架。
赵婧等 | 生成式人工智能法律法规梳理与实务指引(一)——AI生成物的保护
AI律师助手

赵婧等 | 生成式人工智能法律法规梳理与实务指引(一)——AI生成物的保护

作者 | 赵婧 沈琲 罗赓上海申浩律师事务所 目次     一、生成式AI的工作原理二、人工智能生成物是否能够获得《著作权法》保护?三、人类如何拥抱生成式AI?四、我国“提示词”保护的思路的构想2023年7月,世界人工智能大会在上海如期举办,关于机器人、人工智能的新一轮话题热度又直线上升。AIGC(AI-Generated Content,人工智能生成物,此类型AI亦称为生成式AI)自2022年开始迎来了高速发展,不仅与金融、传媒、娱乐、医疗、工业等各行业进行结合,以低成本、高效率的方式满足海量个性化需求,与此同时也孕育着行业业态的新模式。而对AIGC的规制,美国版权局于今年3月发布了关于包含AI生成内容之作品版权登记的政策声明(Copyright Registration Guidance: Works Containing Material Generated by Artificial Intelligence),我国也相应出台了《互联网信息服务深度合成管理规定》与《生成式人工智能服务管理暂行办法》。本专题将结合国际上的规制现状,国内的政策解读,对人工智能生成物是否能够获得版权保护,如何避免人工智能生成物侵权,以及人工智能所涉及的伦理问题等展开一系列探讨与实务操作指引。 一、生成式AI的工作原理 根据《中国AIGC产业全景报告》的定义,AIGC全称为AI-Generated Content,指基于预训练大模型、生成式对抗网络(GAN)等人工智能技术,通过已有数据寻找规律,并通过释放泛化能力生成相关内容的技术。在我们阐释AIGC可能涉及的法律争议之前,先来看看预训练大模型和生成式对抗网络的含义。预训练大模型(LLM),包含了“预训练”-“指令微调”两个步骤。第一步在大规模无标注数据(如互联网文本)上进行模型预训练,学习通用的语言模式;第二步在给定自然语言处理任务的小规模有标注数据上进行模型微调,快速提升模型完成这些任务的能力,最终形成可部署应用的模型。[1]生成式对抗网络,则是由生成器和判别器组成的深度学习模型。生成器主要用以生成和真实数据近似的数据,而判别器主要用于区分生成器生成的数据和真实数据。生成器和判别器共同构成了一个动态的“博弈过程”。我们以时下热门的图像生成式AI及文本生成式AI详细解释。图像生成式AI是指基于给定文本描述,生成图像的AI系统(Text-To-Image,又称T2I)。这受益于计算机视觉行业的进展与深度生成网络研究的突飞猛进。目前扩散模型(Diffusion Model)因操作简便、生成图像精度高而成为最流行的生成模型。这一类的典型代表有Stable Diffusion、Midjourney。早期的模型是通过对图像元素添加关键词,再让指令词与图像信息进行匹配,以此达到用户输入文本,AI输出对应元素拼贴的效果。而扩散模型则在此基础上改良,通过对图片添加噪声(noise),再以计算机神经网络的正向加噪、反向去噪声过程生成质量更高和创造性更强的图像。通过大量的学习训练,AI就能从足够多的素材中学习并生成最接近人类真实世界中的数据。我们再来看文本生成式AI。时下最火的产品莫过于ChatGPT4。开头我们说过预训练大模型(LLM)包含了“预训练”和“微调”的两段式练习,其实GPT在前两代的时候并没有展现出优于其他模型的性能,而到GPT3的时候,突破性地在两段式的基础上加入了in-context学习方式,通过给模型做示范,让模型感知应该输出什么,而不是直接标记最优答案。GPT3通过引导式的学习方式,在超大模型上展现出了惊人的效果:只需要给出一个或者几个示范样例,模型就能照猫画虎地给出正确答案。而GPT4在底层技术原理上并没有超越第三代,而是改变了训练策略,通过人工筛选,不断判断输出的哪些句子是好的,哪些是低质量的,这样就可以训练得到一个reward模型。通过reward模型来模拟人类打分的过程,自动对问题的不同回答打分,模型再根据打分调整参数。即用问题、回答和分值作为数据,用强化学习的方式训练模型。这就是Chat GPT可以模拟情景对话、给出多元化答案,并在和人类的对话中可以不断修正结果的原理。通过对上述生成式AI工作原理的阐述,我们不难发现,AI的学习离不开海量的数据源,而数据来源真实性直接影响了AI输出结果的准确性,而数据源的合法性则可能直接导致对版权、隐私和伦理的争议。而对于AI输出的结果是否能成为法律保护的对象,又是否可能侵害他人的权利,也成为AIGC法律合规的焦点。 二、人工智能生成物是否能够获得《著作权法》保护? 今年3月美国版权局推出了关于生成式AI作品版权的政策声明。在这份声明中,对“生成式AI的生成的材料”和“由人类创作的(human-authored)和人工智能生成材料(AI-generated material)组成的作品”进行了区分。首先该份声明依然坚持了一项基本原则——版权法只能保护“人”的智力创造。因此,由计算机算法自主创建的生成物是无法被认定为“作品”的。而在今年2月,一份由人类作者创作文本、Midjourney生成图像的图画小说Zarya of the Dawn,却得到了美国版权局的认可,被认为构成版权法保护的作品,获得了有限的保护。对此,美国版权局进一步解释,该图画小说中人类创作的文本属于人类的智力成果,符合版权法保护的标准,可以单独登记成为作品;而Midjourney生成的图像,仅仅是基于计算机算法得出的材料,无法独立获得保护,但不影响整个图画小说成为一个完整的作品。那么对于由人类使用生成式AI进行多次调整、修改后的作品是否能够保护呢?在此问题上,该份声明举例了人类使用Photoshop编辑图像的例子。视觉艺术家利用图像编辑软件修改图片,计算机仅仅是一种辅助工具,它不影响人类对作品表达的创作性控制,因而不会影响图片艺术家的“作者”身份。相反,对于由机器自动运行,没有人类作者的任何创意或干预而产生的作品则无法获得保护。而关于在人工智能训练中使用受版权保护的作品在法律上应当如何规制等问题,美国版权局后续也将向社会公众征求意见。因此我们看到了一个有意思的现象,美国版权局没有一刀切地认为只要是AI生成的作品就不是“作品”,而是需要进行个案分析。虽然如何判定人类在作品中的智力贡献,以及是否能够在单件作品中独立区分开人类创作部分和AI创作的部分,是一件在实际操作中并不容易的事情。但至少,该份声明明确了,版权法依然应当以人为本,也奠定了生成式AI应当服务于人类,成为人类工具的基调。而英国在作品的创造性问题方面,则一直主张“额头流汗”原则,即只要作品中存在作者的劳动即可,而无论此项劳动的多少。英国《1988年版权、设计与专利法》明确认可文学、戏剧、音乐或艺术作品如果是由计算机产生的,那么这一作品的作者应当是对该作品的创作进行必要安排的人,此类由计算机生成作品的著作权保护期限系自作品创作完成当年的最后一天起五十年,同时对于此类作品不适用著作人格权。[2]目前,我国现行出台文件均没有对AI生成物是否符合《著作权》法意义上的作品给出结论性评价。而在国内现有的案例中,对于AI生成的作品是否是“作品”也形成了完全相反的观点。让我们先回归法条,我国《著作权法》中所称的作品,“是指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果”,所以作品具有两个实质构成要件:“独创性”和内容属于“智力成果”。那么这里的“智力成果”是否必须为人类的智力成果呢?我们从(2019)粤0305民初14010号“Dreamwrite”案件中可以看出一些判断方向。深圳南山区法院认可了由Dreamwriter软件自动撰写完成的文章可以被认定“作品”,但其在说理部分强调了Dreamwriter软件的自动运行并非无缘无故或具有自我意识,其自动运行的方式体现了原告的选择,也是由Dreamwriter软件这一技术本身的特性所决定……从涉案文章的生成过程来分析,该文章的表现形式是由原告主创团队相关人员个性化的安排与选择所决定的,其表现形式并非唯一,具有一定的独创性。其观点是,人工智能生成内容基于人工智能的控制人或研发人员设置一定的技术、算法而得,其在一定程度上仍属于人类的智力成果。但同时可见,我国法院在判断AI生成物是否是作品的过程中,仍不可排除地需要甄别“人”在作品中的地位和作用。然而随着深度学习技术和大数据等网络技术的飞速发展,人工智能早已摆脱了遵循既定算法和程序的计算机辅助工具的地位,能够独立自主创作。这种自主创作的方式将可能使人对作品的控制性创造作用越来越小。因而,笔者认为,美国版权局的甄别方法或对我国AI生成物的保护具有一定的借鉴和参考意义。当然,我国《著作权法》虽暂无定论,却不妨碍生成式AI的提供者通过与用户订立协议的形式约定生成物的著作权归属。 三、人类如何拥抱生成式AI? 生成式AI给人类带来的冲击感毫无疑问是强烈的,甚至对一些职业造成了现实的威胁,比如游戏制图、影视美术、工业设计等领域,AI看上去稍加训练便可以替代,想象力甚至超越人类。但通过上文对AI原理的分析,我们也可以清醒地认识到,AI虽然具备了深度学习的能力,但仍在模拟人类进行思考,也需要通过人类来甄别一些信息。比如文本生成型AI,当我们需要一个专业领域的LLM时,用于预训练模型中的知识库就显得尤为重要。由于大多数预训练模型都是在通用训练语料上进行学习的,对于一些类似金融、法律等特殊领域中的概念和名词,AI都无法具备很好的理解。所以需要在训练语料中加入一些领域数据,以帮助模型在指定领域内获得更好的效果。这就给了专业领域的人才以新的合作机遇,而未来,训练完成的AI将可能有针对性地适配在各个专业领域内,成为能提高人类效率的良好工具。而图片生成式AI的新赛道则展露的更早,美国早已出现了售卖提示词的网站。在AI的世界里,提示词(Prompt)就是和AI沟通语言的桥梁,通过准确的使用关键词,才能让AI生成出自己想要的、具有稳定风格的作品。而那些能让AI做人类想要让他们去做的事情的专家被称为提示词工程师(Prompt Engineer)。 四、我国“提示词”保护的思路的构想 目前国内外,已有很多使用大模型进行生产创作的实践应用,涉及软件开发、文本处理、图像生成等多个领域,而“如何写出好的提示词”正在成为各个领域热论的议题。接踵而来的,即是优秀的提示词如何能够保护?我们首先来分析其是否能够通过《著作权法》进行保护。一些由词组、短句堆砌而成的较为简单的提示词,由于其本身不能联系成为一个语义连贯,具有独创性意义的作品,因而不属于著作权法保护的对象。而如将古诗词“横看成岭侧成峰,远近高低各不同”作为提示词,亦无法获得保护,因为该作品已属于公有领域,同样不符合保护条件。由此来看,提示词想要获得《著作权法》保护,则可能需要进行非常详细的描述,同时又要具备独创性的特征。如果要求提示词工程师一定要达成上述条件,其智力成果才能获得保护,确实是有些强人所难,更有些强AI所难,因为AI的本质系一系列计算机程序的组合,其善于接受的指令通常应当是简洁、简短、明确的词语或短句,并不需要过多的修饰或完整连贯的意思表示。但一段好的提示词的确需要工程师进行反复的推敲、实验、修改,同时也需要工程师具有一定的计算机软件编程知识或至少应当初步了解其所被提示的AI的基本工作或运作原理,要付出非常极大的努力,不可否认一段优秀的提示词应当被认定是智力成果。那么,在提示词本身的基本表达不能被著作权保护的情况下,是否有更好的保护方式呢?笔者认为,在没有新的法律法规制定和颁布之前,我们可以在现有知识产权法律法规框架体系中寻找适合的方式,首先,提示词的排列组合方式可以被定义为一种方法,而方法是可以通过发明专利进行保护的,简单以绘画类AI举例,当我们需要使用提示词通过绘画类AI生产作品时,提示词通常至少会包含需要绘画的物品、物品的色调、整体绘画的风格,如包含人物肖像,亦需要人物肖像的特征,人物的情绪定义等,对于这么多关键信息,我们采用不同的排列方式将会得到AI生成的不同表达的作品,例如先体定义总体风格并嵌套色调、先定义情绪再嵌套肖像特征与先定义色调、肖像特征最后定义风格和情绪将获得不同的作品,这种方式即方法如具有一定的新颖性和创造性,是可以尝试申请发明专利并获得发明专利的保护的。当然,通过发明专利保护的劣势也非常明显,即一件发明专利的审查期限至少需要12个月,甚至更久,对于提示词规则的生命周期而言,保护是否会滞后可能是需要进一步考量问题;其次,我们来看提示词的本质,即一些具有明确含义的字、词、短语或短句(下文我们称之为“提示词元素”),其中明确的含义一般是指没有歧义,只有准确表达,让AI准确领悟提示人的意图,才能更有效地创作AI生成物(作品),从这一特性我们可以基本断言有效且优秀的提示词元素是有限的,例如可以有效提示肖像的提示词元素是这几个、有效提示情绪的是那几个、有效提示风格的是这一系列、有效提示运动状态是那一系列。这样大家是否想到,或者已经有非常多的企业已经在做的一个工作就是收集并汇总各个领域有效且优秀的提示词元素,并将其分类梳理为数据库,而“数据库”是我国著作权法明确保护的作品客体。所以,即便实际应用的某一段提示词不构成著作权法意义上的作品而不能获得保护,但可以考虑对提示词的分类组合的数据库进行确权和保护,而其关键点可能在于提示词的分类即数据库的字段设置,具体我们将另外行文分析。AIGC可以说是一项最接近普通人的AI运用,它使得AI不再那么高不可攀,只要一台联网的终端,人人都可以通过向AI发出指令的方式进行创作,并得到AI创作物(AIGC)。AIGC让人们体会到了AI的强大、便捷和效率,即便是在当下生成式AI实际应用发展的初期,其已经能为个人、企业解决非常多棘手的、繁杂的问题,其迅速热门也就不足为奇。由此接踵而来的当然是各种法律问题,无论是AI服务的提供者、AI服务的运用者、AI生成的作品的阅读者都会想要了解自己在提供服务、使用服务、浏览作品时应当符合的法律规范,笔者的系列文章意在通过探讨分析我国以及世界相关法律法规并结合自身通过分析得出一些粗浅结论让大家更好地了解AI相关法律问题,并希望能拓宽大家的视野,为大家在AI领域的运用提供灵感。下一篇文章,我们将着重探讨我国对于生成式AI的态度以及相关管理规定的解读,AI生成物如何避免侵权等问题。 注释(上下滑动阅览) 【1】 《大规模预训练模型》,《中国计算机学会通讯》2021年5月第5期,P8【2】 [ 唐蕾.人工智能生成物的著作权保护比较法研究——以元宇宙背景为视角[J].电子知识产权,2023,No.376(03):81-90.]参考文献【1】《大规模预训练模型》,《中国计算机学会通讯》2021年5月第5期【2】《一文读懂ChatGPT模型原理》,JioNLP团队,知乎【3】ChatGPT的工作原理:机器人背后的模型,36氪,百度赵婧专栏文章SPECIAL COLUMN 赵婧 罗庚 | 从郑渊洁案看“在先权利”保护的边界 虚拟偶像法律问题研究:虚拟偶像著作权及人格权问题探讨 法律视角解构NFT 作者:赵婧 罗赓 沈琲 编辑:Sharon 点击图片查看文章...
AI赋能法律工作:律师实用指南
AI律师助手

AI赋能法律工作:律师实用指南

这篇文章主要探讨了人工智能助手在法律工作中的应用及其对律师业务的影响。文章指出,尽管AI技术在语言理解和生成方面具有显著优势,并能帮助律师完成部分重复性和标准化的工作,但AI并不能完全替代律师。同时,如何最大化利用AI工具提升工作效率成为律师们需要关注的问题。文中建议律师应在了解自身工作流程和需求的基础上,尝试将AI工具应用于日常工作中,并通过学习AI使用技巧和梳理工作流程,使AI更好地服务于律师的工作。
ChatGPT:生成式AI的新里程碑?破亿速度的背后,科技与人性的交汇点
AI情感助手

ChatGPT:生成式AI的新里程碑?破亿速度的背后,科技与人性的交汇点

ChatGPT,作为生成式AI的代表,自今年1月起用户量激增,打破了互联网破亿应用最快纪录,显示其强大吸引力。Gartner将其列为2022年战略技术趋势首位,预测到2025年生成式AI将占生成数据10%,大模型因其能微调适应新场景和提升效率,正成为业界重点研发方向。ChatGPT基于Transformer技术,凭借出色表现及与公众的良好互动激发热情,尽管未开源,但通过API服务持续优化。尽管Open AI面临盈利压力,其对通用人工智能的追求和人才吸引是成功关键,并在用户反馈中迭代改进模型。
ChatGPT掀起风暴,AI办公新赛道你准备好了吗?
AI创业助手

ChatGPT掀起风暴,AI办公新赛道你准备好了吗?

文章讲述了ChatGPT API开放以来,AI技术在各个领域的广泛应用和潜力,从巨头的竞相开放API到类ChatGPT应用在办公软件、社交文娱等多方向的初步落地。AI大模型正在改变产业格局,协同办公平台如钉钉和百度文心一言纷纷接入,提供自动文档生成、内容创作辅助等功能,微软的Office工具家族也加入了AI解放"打工人"行列。尽管类ChatGPT技术应用仍处于早期,但创业热已显现,各行业企业正试图抓住这一AI浪潮带来的机遇。同时,AI办公工具也成为小公司和用户关注的新领域,如Notion和Grammarly等提供文本美化服务,展现出10美元/月的价格竞争力。极简版
《数字时代的脉搏:AI、数字化与未来工作方式》
AI律师助手

《数字时代的脉搏:AI、数字化与未来工作方式》

本文讨论了人工智能的发展及其对各行业的影響。自2021年11月OpenAI推出GPT3.0以来,人工智能的参数推升到了100万亿个,使得ChatGPT等AI具备了处理复杂语言任务的能力。随着越来越多的组织开始探索生成式AI和日常业务的融合,全球预计有3亿岗位将被AI所替代。数字技术正以日新月异的速度发展,对人类经济、政治、文化、社会、生态文明建设各领域和全过程产生广泛而深刻的影响。文章最后推荐了五本关于数字技术的书籍,希望读者通过阅读开启数字技术的知识盛宴。