文章主题:自然语言处理, GPT, 聊天机器人, 人工智能

666AI工具大全,助力做AI时代先行者!

ChatGPT是由OpenAI研发的通用聊天系统,于2022年11月30日正式上线,自上线以来,ChatGPT创造了最快达到一亿月活跃用户的记录,成为了当下NLP乃至整个人工智能领域最火的“当红炸子鸡”。相较于之前的聊天机器人而言,ChatGPT所给出的针对用户提问的回答在连贯性与准确度上均有大幅提升,更被开发出了程序编写、代码勘误、诗歌创作、市场研究、金融分析1与论文撰写2与等功能,且均有不俗的表现,被赞颂为“新一代操作系统平台的雏形”、“可以改变世界信息化格局”。强大的功能使得各行各业都在探索ChatGPT对本行业能够带来的变革,法律领域亦不例外。本文旨在探索ChatGPT在法律领域可能的应用范式,思考自然语言处理等技术发展对法律行业的革新作用,谋求人工智能在法律领域更大的可能性。以下将展开论述。

1

ChatGPT技术简介

ChatGPT是自然语言处理(NLP)领域的一款卓越产品,它融合了自然语言理解和自然语言生成的先进技术。产品的名称由”Chat”和”GPT”两个部分构成,其中”GPT”代表”Generative Pre-trained Transformer(GPT)”,意味着生成式预训练转换模型。这个名称生动地描绘了ChatGPT的功能特色和模型架构。ChatGPT以对话系统作为外化的产品形态,它是基于GPT3.5架构开发的。GPT系列模型自2018年6月面世以来,一直致力于通过海量文本数据的大规模预训练,从而掌握自然语言中的各种语义和句法结构。预训练完成后,GPT模型可以通过Finetune方法应用于各种自然语言处理任务,如文本分类、文本生成、机器翻译等。自从GPT系列模型推出以来,随着预训练数据的持续增加和模型结构的日益复杂,其参数也相应地增长。到了2020年,GPT-3模型的参数数量已经超过了1750亿。模型生成文本的能力也越来越出色,充分展现了“大力出奇迹”的原则。

表1-1 GPT系列模型发展历程

深度学习模型的成功应用:以ChatGPT为例

GPT系列模型的基础架构是Transformer模型,这是一种专门用于序列到序列学习的神经网络结构,由Google在2017年首次提出。相比传统的循环神经网络(RNN)和卷积神经网络(CNN),Transformer在处理长序列数据方面有更显著的优势,同时具备更高的并行计算效率。Transformer模型主要由编码器(Encoder)和解码器(Decoder)两部分构成。这两部分都由多个结构相似的模块组合而成,每个模块包含自注意力机制(self-attention)和全连接层(feed-forward layer)两个重要组成部分。自注意力机制主要用于捕捉输入序列中的局部关系,而全连接层则负责对注意力输出进行线性或非线性的变换。自注意力机制是Transformer的核心特点,它通过计算输入序列中各位置间的相对关系,实现了序列中不同位置的信息交互。具体操作过程中,它会将输入序列中每个位置的向量进行比较,并根据相对关系进行加权求和,从而得到每个位置的表示。这种方法无需引入循环结构,就能实现对输入序列中各个位置的全局建模。因此,自注意力机制是Transformer的一大优势。总的来说,Transformer通过自注意力机制对序列数据进行建模,展现出高效、并行化和全局建模等特点。基于Transformer结构的GPT等自然语言处理模型正是通过这种方式进行建模和优化的。

ChatGPT是一种基于GPT技术的对话生成和问答系统,是在原有GPT3.5架构的基础上进行进一步优化和开发而来。为了实现更优质的对话效果,ChatGPT采用了Reinforcement Learning from Human Feedback (RLHF)技术,并在训练过程中进行了人工微调。此外,ChatGPT能够从海量的文本数据中学习自然语言的语义和上下文,并生成逻辑性连贯的回答。它还具备自我纠正和自我学习的能力,能够根据用户的反馈和历史数据不断优化模型,提高对话质量和准确性,特别是在多轮对话中表现更优。由于ChatGPT能够在每次回答时将前述问答内容拼接截取作为模型输入,因此它在多轮连续对话中的效果远超之前的主流对话系统。为了防止ChatGPT被恶意引导而表达出有关歧视、暴力等存在争议的观点,OpenAI为其设置了相关的“禁区”,并确保其在超出知识范围时不会“强行回答”。这一举措体现了技术发展和算法治理的结合,同时也呼应了法律对人工智能的监管,对后续模型发展具有一定的监督意义。

2

ChatGPT在法律领域的应用

2.1 ChatGPT助力法律检索

自ChatGPT启动以来,凭借其丰富的预训练语料库,尽管它并非专为信息检索而设计,但通过适当的提问方式,它可以提供更精确和全面的答案,超越了基于“爬虫 召回 排序”的信息检索范式。此外,由于信息集中在一端和对话式交流的特点,使用ChatGPT获取信息比使用传统搜索引擎进行资料检索更为便捷。在法律领域,律师、法官、法学研究人员以及法学学生等都有大量的日常法律文献检索需求。通过合理的提问设置,ChatGPT可以提供大量的文献和相关资料,帮助用户快速获取所需信息。图2-1至图2-4展示了笔者使用ChatGPT获取民法典相关信息的实践。从ChatGPT的回答中可以看出,它能提供法条内容、法律链接,并能解释相关概念。然而,需要注意的是,由于训练数据的全面性和时效性等问题,ChatGPT提供的答案并不总是正确的。例如,在图2-2中,ChatGPT对民法典基本原则的理解有所偏差。实际上,我国民法的基本原则包括平等原则、意思自治原则、公平原则、诚实信用原则、公序良俗原则以及绿色原则,而不是ChatGPT所述的内容。在图2-3中,ChatGPT对“无权代理”这一法律概念的描述基本正确,但其提供的并非民法典原文,且条数和内容也无法对应。在图2-4中,笔者试图让ChatGPT给出民法典全文链接,但ChatGPT实际上提供了“中国人大网”的首页,并未直接指向民法典全文。总的来说,当前版本的ChatGPT在处理简单的法条文本检索问题上表现良好,但在涉及法律概念的深入问题时表现尚不够理想。尽管ChatGPT能从训练数据中推理并生成文本,可能会产生“以假乱真”的答案,但在实际应用中,我们仍然需要审慎验证其回答的正确性,以免被误导产生错误认知。尽管ChatGPT在回答相关法律检索问题方面无法做到完全正确,但随着数据的进一步扩大和准确性的保证,它在法律检索问题上的表现有望大幅提高。随着技术的不断进步,我们有理由相信,在未来,ChatGPT有可能取代现有的法律检索网站,如北大法宝、威科先行等,成为法律专业人士的高效“私人助理”,极大地提高工作效率。

深度学习模型的成功应用:以ChatGPT为例

图2-1 ChatGPT回答民法典相关问题

深度学习模型的成功应用:以ChatGPT为例

图2-2 ChatGPT对意思自治原则的阐述

深度学习模型的成功应用:以ChatGPT为例

图2-3 ChatGPT对于民法典中“无权代理”相关条文的答复 

深度学习模型的成功应用:以ChatGPT为例

图2-4 ChatGPT对于民法典中“完全民事行为能力人”概念相关条文的答复

2.2 ChatGPT助力法律文本处理

在法律领域,文字作为信息的主要载体,使得文书生成、合同起草以及文书翻译等法律文本处理工作变得普遍存在。在这个环节中,ChatGPT展现出无与伦比的优势,能够广泛应用于各种相关场景,帮助用户迅速满足他们的文本处理需求。举例来说,当前律师等法律专业人士在案件处理过程中,面临大量重复的文书起草和合同审查任务,这种工作被称为“脏活”。虽然技术含量不高,但这些工作却至关重要。ChatGPT凭借其强大的文本生成能力,理论上能够辅助完成相关文件的草稿制作。然而,受限于OpenAI的设计和训练数据,ChatGPT无法直接提供特定法律文书的具体框架。尽管如此,在提供一定信息的基础上,它能够生成一个模板并填充所需信息,如图2-5至图2-7所示。根据ChatGPT的回答,我们可以看出,在提供必要的基础信息后,生成的模板基本能满足用户的需求。ChatGPT的模板生成能力和信息填写能力,能在很大程度上减轻相关人员的工作负担。通过这种方式,在需要大量处理“脏活”案头工作的相关领域,工作压力得以缓解。

深度学习模型的成功应用:以ChatGPT为例

图2-5 ChatGPT无法直接起草裁判文书与劳动合同

深度学习模型的成功应用:以ChatGPT为例

图2-6 在给出信息基础上,ChatGPT能够将其组织成一份合同(前半部分)

深度学习模型的成功应用:以ChatGPT为例

图2-7 在给出信息基础上,ChatGPT能够将其组织成一份合同(后半部分)

ChatGPT在合同起草与文书生成等方面具有出色的能力,同时还能充当“翻译引擎”以及摘要生成工具。如图2-8所示,笔者利用ChatGPT生成了刑事案件案情摘要,结果显示ChatGPT所生成的摘要覆盖了原案情经过的所有关键信息,较之原案情经过更易于阅读。在信息爆炸的时代,文本信息往往存在冗余。因此,将ChatGPT运用在大规模文本数据分析处理与要素提取工作中,可以对执法部门与司法部门的工作提供有力支持。此外,在法学研究和跨国家或地区的联合执法过程中,相关人员经常需要阅读并理解多种语言的多个文档。借助ChatGPT优秀的自然语言处理技术,可以为执法机构提供高质量的翻译和文档处理服务,如图2-9所示。ChatGPT强大的文本处理能力对于法律从业人员日常的文本处理工作具有很大的促进作用。

深度学习模型的成功应用:以ChatGPT为例

图2-8 ChatGPT生成案件事实摘要8

深度学习模型的成功应用:以ChatGPT为例

图2-9 ChatGPT将刚刚生成的案情摘要以英文、日文与韩文格式输出的结果

2.3 ChatGPT助力司法审判

在2023年1月30日,美国哥伦比亚法院在了一起案件中首次采用了ChatGPT作为辅助工具,这标志着ChatGPT首次在司法审判过程中发挥了积极作用。除了前面提到的法条检索和法律文本处理,ChatGPT在类案检索和判刑预测等领域也有可能对司法审判产生正面影响。因此,作者对ChatGPT在司法领域的应用前景进行了深入探讨。在此之前,司法类案检索一直是人工智能在司法领域关注的焦点之一。作者以向某华故意杀人案为例,尝试向ChatGPT询问类似案件的信息,然而由于OpenAI的访问权限问题,ChatGPT无法提供相关案例。此外,鉴于法律事务本身的高度严谨性,ChatGPT也强调了在类似案件的定义和描述上可能会存在差异,并建议寻求当地法律机构或专业律师的帮助。尽管目前ChatGPT在类案检索方面的能力已经足够辅助法官,但因为开发团队的限制,它暂时无法提供我们期望的答案。然而,随着技术的不断发展和完善,我们有理由相信,ChatGPT将在未来的司法审判中发挥更大的作用。

深度学习模型的成功应用:以ChatGPT为例

图2-10 ChatGPT无法给出类案检索结果

在司法审判的其他领域,ChatGPT是否能为法官等人员提供实质性的帮助?为了探究这个问题,作者进一步引导ChatGPT对向某华故意杀人案展开分析。在该案审理过程中,湖南省高级人民法院确定的争议焦点是“向某华的行为是否可以被视为正当防卫或防卫过当”。一审法院认为,向某华故意非法剥夺他人生命,构成故意杀人罪。虽然向某华对向某淼和向某猛的死亡无法以正当防卫或防卫过当的理由辩护,但在本案起因上,向某淼和向某猛的确存在一定程度的过错,而并非重大过错。此外,向某华本身也存在过错。尽管向某华具有自首情节,但这并不能为其从轻处罚。最终,判决结果为被告人向某华犯故意杀人罪,判处死刑,剥夺政治权利终身。二审法院維持了一审的判决。然而,在ChatGPT对本案的分析中,已经呈现出了与人类法官类似的争议焦点判断,如图2-11所示。但是,鉴于ChatGPT对向某华行为是否可以被视为正当防卫或防卫过当这一问题的讨论仍有深度空间,因此需要进一步探讨。在追问过程中,ChatGPT给出了与人类法官相同的判断和解释,如图2-12所示。

深度学习模型的成功应用:以ChatGPT为例

图2-11 ChatGPT对于案件争议焦点的分析

深度学习模型的成功应用:以ChatGPT为例

图2-12 ChatGPT对于向某华行为能否认定为正当防卫或防卫过当的分析

通过前文所述,不难发现,在司法审判中定罪与刑期预测这一方面,ChatGPT能够给出与人类法官相同的判断,这一定程度上说明了ChatGPT对法律文本较为优秀的理解、总结与判断能力。在此基础上,笔者试着对ChatGPT提出了量刑方面的追问,如图2-13所示。但在OpenAI对ChatGPT较为保守的设定下,ChatGPT并未对向某华的量刑给出明确答复,而是认为“具体的刑罚应当根据案件具体情况和被告人的犯罪情况进行裁决”。纵观ChatGPT对于向某华案的回复,笔者认为,其能够作为司法审判领域一个行之有效的文本处理、摘要生成、资料检索与辅助判案的工具。但具体到定罪与量刑方面,则仍需人类法官基于经验等予以判断。考虑到法律的严谨性,ChatGPT在短期内必然不能够取代法官这一工作,但适当的利用可以使得其成为司法审判过程中的得力助手,促进司法部门办事效率的提升。可以预见的是,ChatGPT亦将会在司法审判领域发挥越来越高的价值。

深度学习模型的成功应用:以ChatGPT为例

图2-13 ChatGPT对于向某华案量刑相关问题的回答

2.4 ChatGPT助力法律援助

ChatGPT通过对话方式与用户进行交互,其能够对用户所提出的多样化的问题给出回答。通过前文总结可见,ChatGPT同样亦能够在法律相关问题上给出相对正确而审慎的答复。这就启示我们,能否使用ChatGPT来优化当前的智能法律咨询服务,来更多地惠及广大人民群众呢?这一问题的回答无疑是肯定的。当今社会,低价乃至免费的法律援助服务对于弱势群体来说至关重要。其由于资金、时间或地理位置的原因,往往难以获得其所需的法律援助服务,这使得他们更容易受到不公正的对待。ChatGPT可以提供更便捷的法律信息查询服务。作为一个知识储备库,其可以提供广泛的法律信息,包括法律法规、案例和法律解释等。加之其优秀的上下文理解能力,完全可以对现有的智能法律咨询业务予以革新,即使用ChatGPT提供在线法律咨询服务,在给予更多相关设定的情况下,令ChatGPT通过聊天对话回答用户的问题,提供法律援助,解释法律术语,提供实用建议等。使用ChatGPT还免去了语言限制问题。作为一个多语种的人工智能,ChatGPT可以提供多语种的法律援助服务,使得跨语言沟通变得更加容易和高效,真正做到了“普惠”公众。这一服务对于需要紧急或非专业法律帮助的用户而言非常有用。其不必费时费力地去找律师或咨询机构,或因资金等原因而无法获取法律服务。通过技术的方式,ChatGPT可以让法律服务变得更好。

2.5 ChatGPT能够正确回答法考题吗?

2022年,Michael Bommarito II等人经研究发现,在加入超参数优化和提示工程的前提下,ChatGPT的基础模型GPT3.5能够在MBE练习考试中取得50%以上的平均正确率,且在证据和侵权行为两个类型的题目上达到了平均通过率。11那么,对于法律相关题目,ChatGPT也能够有如此良好的表现吗?为了对此问题予以验证,笔者询问了ChatGPT几道司法考试题目。值得一提的是,ChatGPT的训练数据截止于2022年底的中国司法考试之前,但其在回答2022年司法考试中多个客观选择题时,仍然能有较好的表现,这说明经过大量数据预训练而成的ChatGPT已经具备一定的推理能力。图2-14至图2-16展示出了笔者在询问ChatGPT部分司法考试客观题12时其相应的回答,虽然所选答案并非完全正确,但其对于问题的分析基本到位。具体而言,图2-15与图2-16中,ChatGPT对于问题分析的大体思路均基本正确,但依据ChatGPT的推理,图2-15相关问题应当选择B选项而非A选项。图2-16中,ChatGPT应当选择B选项而非D选项。当前ChatGPT对于问题整体的把握强于细节,这一点通过图2-16中ChatGPT分析得出了“三人均不符合资格条件”但最终却选择了D选项“三人均可担任”即可见一斑。图2-17中ChatGPT对于一道经典法理学论述题的回答亦展现出了这一点。相应尝试启示我们,未来某一天,ChatGPT或能够像“小猿搜题”一般,成为有力的法学界的“教育辅助工具”。教辅相关公司可以使用ChatGPT快速生成问题答案并予以修正,提升教材资料编写工作的效率。教师与学生在遇到疑难问题时能够通过询问ChatGPT的方式迅速得到答案。目前ChatGPT在这一方面主要的问题在于其准确率仍有待提升。但考虑到其不断的版本迭代,有朝一日,或许ChatGPT有机会成为教育领域通用的辅助工具,促进法学乃至整个教育事业的发展。

深度学习模型的成功应用:以ChatGPT为例

图2-14 ChatGPT回答法考客观题1

深度学习模型的成功应用:以ChatGPT为例

图2-15 ChatGPT回答法考客观题2

深度学习模型的成功应用:以ChatGPT为例

图2-16 ChatGPT回答法考客观题3

深度学习模型的成功应用:以ChatGPT为例

图2-17 ChatGPT回答法理学论述题

3

结语

随着人工智能技术发展日新月异,其在各行各业的应用也变得越来越普遍。ChatGPT作为最新推出的预训练大模型,其在文本理解与文本生成方面相较之前的模型表现出了极为突出的效果。可以预见的是,通过对ChatGPT的合理运用,其能够取代律师与法官等群体部分繁杂的案头工作,提升其工作效率。

ChatGPT在信息检索与文献查询等方面具有独特优势,现如今,律师和法官在办案判案过程中需要查阅大量的法律法规和司法判例等文献资料,这些文献资料大部分存储在各种数据库中。使用ChatGPT可以使得检索过程更加高效准确,其可以为律师和法官们提供更快速、更准确的结果,进而得以大大缩短律师和法官的工作时间。此外,ChatGPT还可以将不同法规和判例进行比对,发现其中的关联性,从而提供更加细致和深入的分析。而在文书起草方面,ChatGPT也能够帮助律师和法官减轻工作负担。在现实工作中,法律文书的起草往往耗费大量的时间和精力。使用ChatGPT,律师和法官可以快速、准确地生成各种文书,例如法律意见书、合同起草、诉讼文书等,从而节省了大量的时间和精力。此外,ChatGPT还可以分析法律文书中的语言结构和语义,从而发现其中的漏洞或不妥之处,并进行及时修正和完善。而在法学教育等领域,ChatGPT同样有着自己的用武之地,能够快速且相对准确的回答用户所提出的法律问题,为教学带来便利。

虽然ChatGPT能够在多个领域辅助人类的工作,但在如何利用ChatGPT替代人类工作的问题上,我们需要做出更为细致的分析和思考。例如,在进行辩护或审理案件时,律师和法官需要具备专业法律知识、透彻的法律分析能力、丰富的经验及对案件的敏锐度等,这些是ChatGPT目前无法替代的。ChatGPT在目前仍只能作为人类的辅助工具而发挥作用。在面对具有较高复杂度的案件时,人类仍然需要发挥自己的判断力和分析能力,才能做出更为精准的决策。ChatGPT在法律领域中有着广泛的应用前景,特别是在文献检索和文书起草方面。但考虑到当前技术发展程度优先,我们不能忽略ChatGPT的局限性,仍然需要人类对其进行指导和监督。技术发展的根本目的是服务人类并解放人类,也许,在纬来的某一天,我们能够期待着新一代的ChatGPT能够替代人类完成绝大多数工作,而那时,我们也将真正步入强人工智能时代。

[1] 参见“华尔街见闻”公众号:《ChatGPT可能马上取代你,这是它能做的十个工作》,https://mp.weixin.qq.com/s/FTaPTdEtVhHkCqDh06-XdA。

[2] Perlman A M. The Implications of OpenAI’s Assistant for Legal Services and Society[J]. Available at SSRN, 2022.

[3] Radford A, Narasimhan K, Salimans T, et al. Improving language understanding by generative pre-training[J]. 2018.

[4] Radford A, Wu J, Child R, et al. Language models are unsupervised multitask learners[J]. OpenAI blog, 2019, 1(8): 9.

[5] Brown T, Mann B, Ryder N, et al. Language models are few-shot learners[J]. Advances in neural information processing systems, 2020, 33: 1877-1901.

[6] Vaswani A, Shazeer N, Parmar N, et al. Attention is all you need[J]. Advances in neural information processing systems, 2017, 30.

[7] Ouyang L, Wu J, Jiang X, et al. Training language models to follow instructions with human feedback[J]. arXiv preprint arXiv:2203.02155, 2022.

[8] 该案件事实来源于湖南省高级人民法院(2019)湘刑终104号刑事裁定书,https://www.pkulaw.com/pfnl/95b2ca8d4055fce15c3066f17fb68a2c15e954bdce6421afbdfb.html?way=listView。

[9] 参照https://procesojudicial.ramajudicial.gov.co/FirmaElectronica。

[10] 参照(2020)最高法刑核78412609号刑事裁定书,https://www.pkulaw.com/pfnl/95b2ca8d4055fce15c3066f17fb68a2c15e954bdce6421afbdfb.html?way=listView。

[11] Bommarito II M, Katz D M. GPT Takes the Bar Exam[J]. arXiv preprint arXiv:2212.14402, 2022.

[12] 根据网络公开资料整理而成。

撰稿 | 张亦斌,清华大学法学院计算法学方向硕士研究生

选题、指导 | 刘云

修订  |  胡伊然

编辑 | 王欣辰

注:本公众号原创文章的著作权均归属于清华大学智能法治研究院,需转载者请在本公众号后台留言或者发送申请至computational_law@tsinghua.edu.cn,申请需注明拟转载公众号/网站名称、主理者基本信息、拟转载的文章标题等基本信息。

深度学习模型的成功应用:以ChatGPT为例深度学习模型的成功应用:以ChatGPT为例

自然语言处理, GPT, 聊天机器人, 人工智能

深度学习模型的成功应用:以ChatGPT为例

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!