文章主题:北大团队, 中文法律大模型, ChatLaw, 法律知识库
北大团队推出了首个中文法律大模型落地产品——ChatLaw,旨在为广大民众提供普及化的法律服务。该产品具备文件支持、语音输出的功能,并且能够协助进行法律文书撰写、提供法律建议以及推荐法律援助资源。
法律大模型与幻觉
大语言模型为我国法律行业注入了科技的魅力。它的出现使得原本复杂难懂的法律知识变得易于理解,让用户在与模型的多轮对话中不断接近事实真相,从而从中获得准确且专业的法律建议。然而,语言模型所面临的一个无法回避的问题在于,它可能会生成带有偏误信息的幻觉内容。例如,当用户向ChatGPT提出法律问题时,有时会得到含糊不清,甚至不正确的回答。
这一现象的本质是,ChatGPT数据集中并未包含中国法律,它不具备中国法律知识。
作为一名科研工作者,对于模型所引发的问题,尤其是涉及到法律领域的严重问题,我们始终无法回避。对于技术的提供者来说,我们有责任确保模型生成的内容是准确且可靠的。仅仅依靠法律对话数据的微调,是难以在实际法律场景中得到应用的。即便是最先进的模型如GPT4,在处理法律问题时也可能出现幻觉和偏误。因此,为了保证模型生成的稳健性,我们需要从模型训练阶段开始就进行干预和引导。我们利用海量的判例文书原始文本、法律法规以及地方政策,构建了一个全面的法律知识库。
在保证知识库的实时更新和专业性的同时,我们与北京大学国际法学院及知名律师事务所展开合作,以增强其数据可靠性与专业性。在训练过程中,我们大规模地将法律数据输入模型,并通过特殊处理和强化,确保模型在后续推理中拥有法律先验知识,并保持稳定性。此外,我们还设计多个模块,整合通识模型、专业模型和知识库,以便在推理时提供更全面的支持。通过实施约束,我们在模型生成法律法规的过程中,可以有效避免模型出现错误,从而降低模型幻觉的风险。
我们将整个技术方案称为“先验知识约束”,这是一种能够保证模型生成的法律内容准确性的方法。为了验证其有效性,我们的团队的一位成员特别整理了过去十年的中国国家司法考试题目,并构建了一个包含2000个问题的测试集。通过采用ELO评分系统进行评估,我们发现ChatLaw模型在测试集上表现最为出色,取得了最高分数。这无疑证明了“先验知识约束”的显著作用,它使得拥有海量参数的模型在专业问题上仍能保持较高的准确性。
“先验知识约束”机制能够保证模型所提供的法律建议更加精准。得益于语言模型的特性,用户即便运用自然语言提出基础问题,也能够获得智能程度较高的回答。在这种背景下,用户可以通过多次对话,不断向大语言模型补充事实细节,从而使获取具有实际指导意义的法律建议变得切实可行。
调度模型
但只是准确还不够。法律咨询是高度复杂的场景。其流程标准化,但当事人事实具有多变性。这意味着,模型的智能度是至关重要的要素。为了提升模型智能度,同时增强模型的延展性。我们用了一个“取巧”的办法。那就是“调度模型”的概念。我们用针对性微调,训练了一个专用调度模型。我们为调度模型准备了一个极其丰富的模型&插件库。调度模型通过对用户提问进行语义理解,来对子模型和插件进行调度并重组,最终呈现出多个模态的输入和输出。
这套体系允许我们整合文件、音频和文字多种元素,并提供法律援助、法律文书以及思维导图等多样化输出功能,从而赋予我们的产品高度的灵活性和拓展性。举例来说,如果我们的AI模型发现用户的描述并不十分明确,它会提示用户上传相关文件,并根据这些新的信息进行深入的分析和归纳。
不仅仅是归纳事实,ChatLaw还会基于事实生成具体的法律建议、甚至是法律文书。
当用户表露出需要人工服务的意图,模型还会向用户推荐周边的法律援助中心。
通过调度模型的应用,我们能够为产品拓展出更广阔的发展空间。经过针对性的训练,我们可以实现与市场上各类主流的LLM系统的无缝对接,同时也能满足符合规范的业务接口需求。展望未来半年,我们的目标是在法律行业中覆盖主要的工作场景和业务领域,从而实现更高层次的智能化应用。
横向对比基于ChatGPT的AI法律咨询
直接关注“律需网”微信公众号,点击左下角键盘进入对话模式,输入您想问的问题即可。
感兴趣的用户,可以对比下两者AI法律咨询方面的区别。
律需法律平台,原文转载 ^_^
https://luexu.com/w/11723092197401
Luexu.com
↑ 点击关注 ↑律需网,真实的律师服务平台以事释法请关注
↑ 点击关注 ↑真人真事,以事释法,通俗易懂AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!