文 / 中国银行 欧阳清 王沁
金融业是大模型落地的重要领域,大模型技术的全新能力已经在金融客户服务、风险管理、内部辅助、知识管理、IT支持等方面得到应用。金融大模型有助于金融机构降本增效提质,扩展金融服务场景,并可能引发金融服务入口的变革和迁移。金融业作为强监管行业,规模应用大模型仍存在“最后一公里”问题:一方面来自大模型本身存在可信性、可解释性差、安全与隐私泄露、计算成本昂贵和知识产权保护困难等固有问题,另一方面来自金融行业有较高的准确性、专业性、实时性及安全性的内在要求。
金融大模型的应用路径
金融机构应用大模型技术,可充分考量业务场景的特点以及应用的风险、收益、成本等因素,从语料准备、模型融合、场景挖掘、算力部署和治理升级五个方面探索应用。
1.语料准备。拥有足够规模的高质量语料是大模型成功应用的基础,发掘、准备优质的语料数据是金融大模型应用的前提。语料数据涵盖文本、音频、图像、视频等模态,金融机构可从拓展语料来源和提升语料质量两个方向着手建设自身的语料库,其中可优先建设文本数据语料库。
在拓展语料来源方面,一是要外部扩建,拓展多元稳定数据来源,建立数据资产库。通过与知识产品类和数据富集类机构建立紧密协作关系,获取金融通用语料和公共信息;与各行业代表性企业之间银企合作,获取垂直行业语料数据;通过金融从业机构和信息服务商合作,获得高质量的金融专业语料与专业知识。二是内部挖潜,在合规的前提下,深度利用既有知识,包括内部研究机构的资料库、规章制度库等语料知识库、内部日常管理和运营中所积累的语料信息库等语料信息,建立企业内部知识库。
在提升语料质量方面,主要关注维护语料的准确性和多样性,确保大模型的输出能力和泛化能力。一是提升语料准确性,采用专业的人工审核、多渠道数据验证等方法,确保信息的准确性;建立用户反馈机制,及时发现和纠正模型出现的准确性问题;关注数据时效性,持续监测并根据需要进行必要的知识更新和调整。二是扩展语料多样性,增强专业性覆盖,确保语料库涵盖各种细分专业情景和语境;更新管理不同来源的数据,定期对现有语料资产进行更新。
2.模型融合。将大模型与现有IT资产做好融合是大模型成功应用的关键,其中大模型与AI小模型共生同治是金融大模型应用的难点。金融机构可采用串联调用、混合外挂、融合替代等三种模式推动自身AI能力的有效融合,充分发挥大模型的价值和原有IT资产的作用,在一定程度上克服大模型输出结果不稳定、不准确甚至错误等“幻觉”问题。
一是串联整合。小模型用于处理规范准确度要求高、可预设规则且发生频次较高的业务场景,而大模型用于处理无需高精度、需要创意的业务场景,灵活运用模型“插件”、AI助手分诊台等技术,通过AI小模型和大模型间的直接双向调用或中介调用,实现各司其职,分工合作。二是集成混合。根据混合专家模型(MOE)与集成学习分思想,采用外挂知识库(包括向量数据库、图数据库两种方式)和模型库(原有小模型)的方法,通过以大模型为主导、多模型集成的方法实现模型融合:大模型向边、端的小模型输出能力,小模型负责实际的推理与执行,并向大模型反馈算法与执行成效,实现各取所长,优势互补。三是替代融合。以大模型逐步替代的方法实现模型融合。通过大小模型结果评价比较机制,对原有小模型任务中适合由大模型处理的场景,用大模型进行逐步融合替代,直至完整替代,实现先立后破、融合替代。
3.场景挖掘。金融大模型需要依托具体应用场景发挥价值,选择适宜的应用场景是充分释放大模型价值的核心所在。金融机构并不缺乏应用金融大模型的需求和场景,可遵循由内而外、由点及面、逐步推进的原则审慎选择金融大模型的应用场景。在旧场景赋能方面,金融大模型可为现有AI应用业务场景赋能升级;在新场景发掘方面,金融大模型可为银行内外部用户提供新的智能服务渠道和功能。需要注意的是,尽管金融大模型已在多种应用场景中有试点探索的成功案例,但是在规模推广时会遇到具体问题,影响金融大模型的应用普及。
为了更好地协助金融机构挖掘大模型的应用场景,建议可从如下五个维度审慎考虑使用金融大模型的场景:其一是大模型“是否面客”,基于技术现状,目前采用大模型直接“面客”的场景风险较大,应谨慎应用,建议先在内部场景试点成熟后再考虑对外大规模服务;其二是对大模型输出结果的“容错度”,大模型存在“模糊”“黑箱”特性,应依据具体业务对大模型输出错误结果所带来损失的“容忍”度来决定能否在该场景应用大模型;其三是大模型对决策的“影响深度”,金融大模型不同的应用深度对业务造成的风险是截然不同的,对高风险的业务场景应谨慎选择;其四是需求所需的泛化能力,不同场景对大模型的泛化能力是不同的,对于不确定性较高的任务可考虑采用大模型增加其泛化能力;其五是成本效益原则,大模型最终须实现经济或社会效益,现阶段大模型训练和推理成本依然较高,实践中应详细计算投入产出效果,避免盲目投入。
4.算力部署。在金融机构引入并应用金融大模型需具备一定规模的算力基础设施以及巨大的资金投入,设计布局大模型所需的算力部署策略是高效发挥大模型能力的基础。金融机构可提前确定大模型选型、算力基础设施部署、自主可控技术栈验证等三项决策,为金融大模型的有效应用夯实基础。
一是适合自身的基础大模型。常见的选型策略包括选择开源大模型、联合研发大模型和采购商用大模型三种,应根据自身资源禀赋能力,平衡风险、收益和成本的原则来予以选择。较为成熟的做法可优先选取通过工信部认证的商业大模型或与相应的供应商共同研发自身的金融大模型。基于BLOOM、ChatGLM、LlaMA等开源大模型,需要金融机构有更高的技术能力和风险承受能力。
二是与模型相适配的算力部署架构策略。大模型所需的算力基础设施有三种部署方式:私有化、行业云、公有云。其中,私有化部署是绝大多数金融机构的不二选择。私有化部署具体包括以下三种方式:合作部署、“大模型+微调”、“预训练+微调”。金融机构应重点从数据安全角度出发,依据自身技术实力,选择其大模型的部署方式。
三是国内智算设施技术栈选型。AI智算设施底层基本依赖GPU支撑,而受制裁法令的要求国际主流的GPU供应商目前无法对我国供货,因此必须做好国内智算设施的验证和选择工作。同步跟进和掌握自主可控AI芯片、GPU及其光联设施的技术动态,配合国家政策,逐步储备和应用基于自主可控芯片的智能算力资源,繁荣自主可控智能算力生态。
5.治理升级。金融机构引入并应用金融大模型,将加速机构组织、人员和能力的变革和升级,建立良好有效的组织级AI治理是发挥大模型能力的重要保障。金融机构可针对使用大模型具体应用场景需要,重构或转型机构自身的治理模式。
一是健全AI治理架构。完善顶层设计,建立组织级的AI治理伦理委员会,明确人工智能应用治理策略和各个层级的职责,定期组织对人工智能应用情况进行审查和监督,加强人工智能发展潜在风险的研判和防范,确保金融大模型应用符合伦理法规的规定和要求。另一方面,根据国家对于大模型应用的鼓励创新政策,加强金融大模型相关的创新治理机制建设,支持金融大模型基础技术、工程应用和成果转化,鼓励自主创新、推广应用和国际合作。
二是完善AI管理机制。完善AI风险管理体系,建立完整的、覆盖全生命周期的风险管理制度体系和标准体系,确保风险的有效识别、评估和防范;构建AI安全评测认证体系,建立和合作完成隐私保护、价值评估、内容审查等工具、标准和认证模式;构建AI风险监测预警体系,对大模型带来的数据泄露风险、用户违规行为、有害内容生成等方面进行跟踪监测、动态掌握其产生的危害,及时纠正不当行为;完善AI风险的应急响应机制,防范声誉损害、信息安全泄露等突发事件,及时响应和处理大模型应用带来的问题和事件。
三是做好AI队伍建设。大模型重新定义了新型的人机关系,将改变原有的日常业务处理流程,对现有人员的技能升级提出了更高的要求,应做好相应的人力资源教育培训和转型规划,提升现有人员使用AI工具的意识和技能。通过大模型引入应用的工程项目,培养建立AI大模型相关的提示词工程师、AI研发工程师、测试工程师、大模型训练员、内容反馈审核员、大模型运营师等新型AI人才队伍。
金融大模型的发展趋势
金融大模型的发展时间较短,问题和挑战仍未充分暴露,金融机构应加强对金融大模型发展动态的研究,研判下一步的发展趋势。
1.规模应用还要假以时日。当前,金融大模型的应用主要集中在探索、研发或试用阶段,出于审慎经营、风险管控的原则,绝大多数金融机构在大模型应用中仍然处于内部测试、建模研究、团队搭建甚至内部探讨阶段。尽管短期1-2年还会有金融大模型落地探索的实践案例的报告,但业界普遍认为金融大模型将得到大规模的实践应用大约还需要五年时间。
2.亟待进一步的理论突破。多/跨模态、低幻觉、强逻辑、低能耗将成为大模型发展和竞争热点。预计2024年,大模型的多模态生成/跨模态认知、低幻觉甚至零幻觉、复杂问题的逻辑推理能力的研究是理论界的研究热点,构建低能耗(水耗)的大模型是产学研共同关注的研究方向。金融机构可及时关注和跟进相关研究突破,在探索实践过程中充分应用研究成果。
3.版权保护影响未来走向。《纽约时报》案件的判决结果可能将是大模型未来发展的分水岭。由于大模型生成结果高度依赖语料,但输出成果不体现原有智力成果知识产权,因此引发知识产权人的诉讼是迟早的问题。美国法院的判决有可能对全球监管政策走向产生影响,从而波及大模型的下一步发展,金融机构可密切关注相关诉讼及其他相似案件的判决结果。
4.发展可能将进一步放缓。OpenAI近期发生了领导权争夺大剧,反映出高速发展优先还是AI伦理安全优先之间存在着巨大的“理念矛盾”;大模型性能线性提升、大模型幻觉等问题的解决仍存在“理论瓶颈”;大模型训练的高质量数据已被基本利用,面临“数据枯竭”。基于以上因素,通用大模型的大版本升级及升级效果有较大可能会低于业界普遍预期。
5.多模态及安全值得关注。相比大语言模型,多模态大模型应能像人类一样能够理解和处理不同模态的信息,实现信息融合,对跨模态、跨领域任务进行深入理解,更好地胜任不同场景的需求并支持相关业务发展。另外,基于多模态的AI应用极大可能攻破金融机构现有的生物识别类的客户验证安全体系,需提前准备相关验证安全风险的防范措施。
金融大模型的工作展望
金融大模型的规模应用是大势所趋,在大模型技术供给侧持续解决完善相关问题的同时,建议金融机构提前布局规划,做好金融大模型规模化应用前的准备工作。
1.数据工程是当务之急。相比较金融业,其他产业的产业化、垂直化大模型发展可能会发展较快,政府、企业结合自身私有数据训练或者微调垂直大模型同样离不开对于数据预料的处理。因此,对数据收集、清洗和提炼的语料数据工程将逐步走向成熟。金融机构可基于相关的数据工程方法论成果,结合自身行业特点,尽快开展自身机构的语料数据工程,为后续金融大模型的规模应用奠定坚实的基础。
2.审慎引入通用大模型。大模型的建设成本主要发生在模型层,大模型的盈利来源在应用层。早期大模型供应商可通过模型授权等方式完成商业化获利,但随着竞争加剧(百模大战),模型层或将迎来一轮淘汰和聚集,为了确保生态位,越来越多的通用大模型或将走向开源和免费,通用大模型的引入成本会随着时间的发展而有所降低,因此,金融机构可在充分研究各通用大模型的基础上,选择适合自身禀赋的通用大模型。
3.融合能力建设是关键。随着MAAS模式的逐步成熟,金融机构的服务将与其对大模型的融合水平息息相关。因此,金融机构应加强研究和推进大、小模型协同、生成式技术与传统人工智能技术协同,明确大模型接入传统系统、大模型派生小模型、原有小模型升级等策略,做好大小模型融合的技术架构并开展相关技术储备,提升金融机构AI模型融合能力,提升金融机构及其服务的智能化水平。
4.算力自主可控需适配验证。大模型训练离不开底层算力(GPU服务器),目前英伟达GPU相比国内同类产品,在性能和模型适配性等方面有明显优势,且对华禁售的态势短期内不会变化,虽然英伟达仍在不断推出针对中国的阉割版硬件,但算力限制是制约国内大模型发展的“卡脖子”问题。因此,对相关的国内硬件资源的验证与适配是关键路径,金融机构应基于国内硬件训练的大模型框架,及早开展技术储备和技术栈的选型。
5.探索智能体应用场景。自主智能体agent的集成和应用是大模型落地的主流方向。大模型支持的智能体应用,包括基于大模型赋能的智能体数字员工、具身智能体和机器人员工等形态,可集成RPA、BPM等传统智能工具,提供动态实时的业务流程优化,极大提高效率和生产力,有望成为金融大模型规模应用的主要产品形态和解决方案。金融机构应加强大模型加持的自主智能体的探索应用。
(此文刊发于《金融电子化》2024年4月上半月刊)
新媒体中心
主任 / 邝源
编辑 / 姚亮宇 傅甜甜 张珺 邰思琪