为深入贯彻落实党的二十大、二十届三中全会精神和中央金融工作会议部署,积极响应国家关于保障金融业高质量发展、提升金融标准化水平的号召,在2024年9月“金融教育宣传月”期间,北京银联金卡科技有限公司(银行卡检测中心BCTC,国家金融科技测评中心,以下简称银联金卡)举办了“加强质量支撑 共建质量强国”标准解读系列专题活动。通过这些专题活动,不仅深入剖析了标准的核心内容,还采用一图读懂、线上公益讲座等多种传播方式,推动金融知识能够精准触达基层群众,提升公众的金融素养与风险防范能力,为助力金融业健康安全发展奠定了坚实基础。
本文将带您回顾《大模型金融应用评价规范》重点内容,一同重温精彩课程。

一、大模型技术:金融创新的双刃剑
人工智能大模型,尤其是大规模语言模型,在金融领域展现出了巨大的潜力。从客户服务到风险管理,从交易监控到市场分析,大模型的应用场景不断拓展。然而,随着应用的深入,安全事件频发,包括隐私数据泄露、网络安全威胁、社会安全问题以及知识产权争议等,这些问题对大模型的安全性和合规性提出了严峻挑战。
大模型在金融领域的应用,不仅需要处理大量的敏感数据,还需要确保其输出的准确性和合规性。技术缺陷、应用过程中的安全风险以及金融专业性不足,都是大模型在金融领域应用时需要面对的问题。由此,大模型的安全合规挑战,成为了金融行业亟需解决的问题。

随着人工智能技术的快速发展,全球范围内对大模型的监管已成为共识。各国纷纷出台相关政策和标准,以确保大模型技术的健康发展。在中国,信息化标准建设行动计划(2024-2027年)已经启动,大模型金融领域的行业标准也正处于立项准备阶段。同时,北京银联金卡科技有限公司(银行卡检测中心BCTC,国家金融科技测评中心,以下简称银联金卡)作为牵头单位,联合了大型国有商业银行、股份制银行、高校科研院所、头部科技公司等20余家单位,共同组建了专项小组,开展了全方位、多层次的市场调研,积极参与大模型金融应用标准的制定工作,形成了《大模型金融应用评价规范》(以下简称《评价规范》)。
《评价规范》的制定,旨在通过明确大模型在金融领域的应用要求与评价标准,为金融机构提供更加准确、全面的选型指导。同时,助于提升大模型金融应用的安全性、可靠性以及服务质量,为金融行业的数字化转型提供有力支撑。
二、标准出台:构筑大模型金融应用的“安全网”
《评价规范》主要通过通用知识与能力、金融知识与能力、安全要求以及性能四个维度,对大模型展开多方位评价。测评框架包括总则、知识与能力、安全要求以及性能等多个方面,旨在全面评估大模型在金融领域的应用能力与服务质量。其中,通用知识与能力决定了大模型与用户交互时的准确性、流畅性和适应性;金融知识与能力是能否胜任金融领域应用的关键;安全要求是决定大模型是否可用的基础;性能评价则对模型的效率与功耗提出了要求。

在知识与能力评价方面,《评价规范》要求大模型具备广泛的知识储备和语言理解能力,以准确理解用户的意图并给出恰当、有针对性的回复。同时,大模型还需掌握金融专业知识,了解金融术语和概念,并能够运用金融知识进行分析和预测,这些要求有助于确保大模型在金融场景中的专业性和可信度。
安全要求是大模型金融应用评价的重要一环。《评价规范》要求大模型在语料数据生成与管理、生成内容安全性、稳健性和伦理性等方面严格遵循相关规定。这包括确保语料数据的合法合规性、保护用户隐私和数据安全、防范恶意攻击和滥用等。此外,《评价规范》还要求对大模型进行持续的安全监测和风险评估,及时发现并处置潜在的安全隐患。
在性能评价方面,《评价规范》关注大模型的可扩展性、效率与能耗等指标。这些指标有助于衡量大模型在处理复杂任务时的性能和效率,以及其对计算资源的消耗情况。通过性能评价,金融机构可以选择适合自己需求和硬件条件的模型,从而提高服务质量和运营效率。
三、测评服务:推动大模型金融应用的健康发展
为了推动《评价规范》的有效实施,银联金卡建立了针对大模型金融应用的专业评估能力。通过构建高质量的测评数据集和自主研发“离朱”大模型自动化测评平台,银联金卡能够全面评定大模型在金融领域的适用性和效能水平。同时,银联金卡还联合多家机构共同探索金融行业大模型测评规范的建立,通过多元协同,全面提升标准的可靠性。
《评价规范》的测评对象主要包括各类应用于金融领域的大模型产品。通过测评,可以全面了解大模型在金融场景中的表现情况、应用能力与服务质量,为金融机构提供科学、客观的大模型选型依据。此外,测评结果还可以作为金融机构优化大模型应用、提升服务质量和运营效率的重要参考。

在测评方式与流程方面,《评价规范》采用了全面评估的方法,评价维度全面覆盖、评估要点合理设置、应用需求精准适配。测评过程包括测评样本的自动生成、测评结果的自动评估、测评记录的自动留存以及测评模型的自动管理等环节。通过这一系列流程,可以确保测评结果的客观性和准确性。
随着《评价规范》的出台和实施,大模型在金融领域的应用将更加规范、有序。金融机构在选型和应用大模型时将有更加明确的标准和依据,从而降低选型风险和应用成本。同时,《评价规范》的出台也将推动大模型技术的持续创新和优化升级,为金融行业的数字化转型和高质量发展提供有力支撑。未来,随着金融科技的不断发展和创新,银联金卡将持续关注新技术、新应用的发展动态,不断完善和优化自身的评估体系和能力建设,同时,积极探索新的测评方法与技术手段,共同推动大模型金融应用的标准化、规范化发展。
扫描下方二维码,立即观看课程

点击【阅读原文】,即可观看精彩课程内容!
