天风计算机团队
作者 | 缪欣君 详细信息请联系 | 李璞玉摘要
当前市场大家普遍认为,大模型基于其通用性,会在C端市场攫取更多发展空间。但结合论文《GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large Language Models》中的观点,大模型的能力或在未来引起行业层面对人力资源的需求降低。产业的变革,由产业的软件触发。据此我们判断,当前时点大模型在B端的发展机会或被低估。
从落地角度看,GPT在金融业推广的两个基础已经具备。1)看需求,客服与销售人力成本高昂有望为AI替代提供广阔空间。金融行业人力支出高企,以保险为例,代理人薪酬开支达万亿,IT支出仅为其的1%。考虑保险代理人数量持续下滑,我们判断保险公司或有意愿探索更高效的业务拓展方式。2)看场景,AI在金融行业多领域已具备使用基础,落地场景丰富。根据产品分类,现有金融+AI应用的包括AI风控、智能客服、智能营销、智能保险、智能投顾、智能投研等。过于由于技术能力限制,AI相关的交互往往体验不佳。而大语言模型卓越的情感分析、意图识别与学习能力有望有效解决这一问题。
从技术角度看,预训练模型调优与自研大模型有望为金融业AI应用再赋能。在优质语料库的预训练下,LLM可以获得基本的语言理解和生成技能。指令调优可以提升大模型在金融领域对专业性问题的理解能力。对齐调优有望保证金融行业大模型落地的合规性。
对于金融IT公司,业务理解与训练数据构成AI核心竞争力。我们认为,1)服务于准确性,训练数据的质量与数量构建成为金融领域大模型应用的核心竞争力。2)服务于可用性,基于对业务的理解基础,对产品进行AI赋能,保证了应用软件最终的可用性。
在数据+业务理解能力双重占优的背景下,我们判断头部金融IT厂商有望受益于本轮技术革新,构筑新一轮的成长。
彭博社发布的BloombergGPT显示出金融界大模型的应用潜力。而受益于金融IT基于AI的应用基础,以及明确的市场需求潜力,金融领域的GPT革命或刚刚开始。
建议关注金融IT相关标的:ToB:保险IT:中科软、恒生电子、新致软件等。证券IT:恒生电子、顶点软件、金证股份等。银行IT:长亮科技、京北方、宇信科技、软通动力、神州信息等。ToC:同花顺、东方财富(海外&传媒组覆盖)、指南针、财富趋势等。风险提示:AI应用落地不及预期;金融GPT进展不及预期;大模型进展不及预期。
前言:由OpenAI论文看B端金融GPT的潜力
2019年以来,大语言模型能力加速提升,入局厂商与模型涌现。据Wayne Xin Zhao等人论文《A Survey of Large Language Models》统计,2019年以来,参数量超过10B的大模型有47个,其中开源大模型20个,闭源大模型27个,大语言模型迅速发展。大语言模型对各个行业均有影响,对金融行业的潜在冲击最大。根据OpenAI论文《GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large Language Models》统计,ChatGPT 和使用该程序构建的未来应用可能影响美国大约 19% 的工作岗位至少 50% 的工作任务。同时,OpenAI还统计了各个职业相对于大语言模型的暴露率,证券、保险等金融行业暴露率排名靠前,表明AI或将对现有金融行业工作的潜在替代率最高。
当前市场大家普遍认为,大模型基于其通用性,会在C端市场攫取更多发展空间。但结合OpenAI论文《GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large Language Models》中的观点,大模型的能力或在未来引起行业层面对人力资源的需求降低。产业的变革,由B端的软件触发。因此我们认为,当前时点大模型在B端的发展机会或被低估。
在此背景下我们展开思考,对toB金融IT行业需求与变局进行结构性梳理。
01
GPT在金融业推广的两个基础已经具备1.1.看需求,客服与销售人力成本高昂有望为AI替代提供广阔空间金融行业客服和销售员工占比大。截止2021年12月31日,银行、保险、非银行金融和证券行业A股上市公司客服和销售员工占比分别为86%、75%、50%和42%,位于全A股上市公司所属33个行业中的1、2、5、7名。
2022年,中国人寿102238名员工中,从事销售的员工人数占比达45%;核保、赔付与客服员工人数占比达23%。即公司68%的员工为客服和销售员工。
金融行业人力支出高企,以保险为例,代理人薪酬开支达万亿,IT支出仅为其的1%。保险行业人力成本高昂。根据银保监会数据显示,截止22年H1,保险经纪人数量达到521.7万人,假设人均薪酬在2万/月,仅保险代理人薪酬开支则就到了万亿。对比之下,保险IT解决方案市场规模仅101.2亿元,即使17~21年间CAGR达14%,仍为保险公司支出的一小部分。我们认为,高昂的人力成本有望促使金融行业有动力通过AI进行部分人力替代。
考虑保险代理人数量持续下滑,我们判断保险公司或有意愿探索更高效的业务拓展方式。近年来,保险代理人数量持续下滑,2022H1,中国保险代理人数量为521.7万人,2019-2021年呈持续下降趋势。我们认为,保险代理人数量下滑,也反映了当前保险公司有意改变通过堆积人力渠道触达客户的方式。在此背景下,技术或成为补充人力销售的重要手段。
1.2. 看场景,AI在金融行业多领域已具备使用基础,落地场景丰富AI在金融行业多领域已具备使用基础,通过大模型优化现有技术值得期待。在营销领域,AI赋能智能营销、智能投顾、智能客服、智能培训等场景;在资管领域,AI赋能智能尽调、智能审批、智能放款、智能投研等场景;在风控领域,AI赋能反洗钱、反欺诈、智能征信、智能风控等场景。我们认为,未来随着大语言模型的发展,有望出现更多应用场景落地。
根据产品分类,现有金融+AI应用的包括AI风控、智能客服、智能营销、智能保险、智能投顾、智能投研等。根据艾瑞咨询研究,回顾2020年,AI已经被广泛应用于上述领域。但过去AI能提供的能力有限,在大模型带来的变革下,其通用性、逻辑推演能力、内容生成的能力有望为这些环节能力带来跨越式发展。
场景一:智能客服
2019年,平安人寿智慧客服以开始以科技赋能全渠道服务,实现APP、柜面、电话体验升级。智能客服中包含 1)平安AI视频回访机器人,作为多模拟态合成机器人应用,可以与客户进行拟真形象视频交互,解决相应问题;2)平安AskBob小桂圆,是平安人寿推出的多轮对话客服机器人,主要提供咨询应答和差异化服务推荐;3)空中门店,通过客服柜员在线1对1服务,服务客户在云端办理业务。
过去智能客服已有深度学习算法的介入,实现问答调优、情感分析、意图识别、语义分析等。但是基于小模型路线的智能客服对情感分析与意图识别的能力有限,无法解决客服场景里“无限”的具体问题,最终导致用户体验不佳。而大语言模型卓越的情感分析与意图识别能力有望解决这一问题。
场景二:智能投研
Bloomberg计划将把GPT类AI能力整合到彭博机中。Bloomberg LP 使用与OpenAI的GPT相同的底层技术开发了一种人工智能模型,并计划将其集成到通过其终端软件提供的功能中。我们认为,彭博作为投资研究领域的全球龙头,把GPT的能力整合与投研终端机中,对金融领域GPT能力的应用推广具有极大借鉴意义。将AI作为先进生产力工具,自动化完成过去投研分析过程的部分任务有望成为趋势。
场景三:智能风控
现有智能风控主要基于大数据进行自动化估值、智能审批、智能控制、智能预警、智能催收、智能监测、智能分析。以某农商行为例,通过搭建个人消费贷款产品纯线上大数据风控体系,为银行风控决策的水平和智能化程度带来极大提升,整合行内外200+风控标签,打造80+策略规则,形成从反欺诈授信策略、风控模型、定额定价、贷后监控的全信贷生命周期的管理,自上线以来,审批通过率40%+,不良率<=1%。
02
预训练模型调优与自研大模型有望为金融业AI应用再赋能2.1. 数据是预训练与模型调优的基石预训练奠定了LLM能力的基础,核心是预训练语料库的规模和质量。通过对大规模语料库的预训练,LLM可以获得基本的语言理解和生成技能。在这个过程中,预训练语料库的规模和质量是LLM获得强大功能的关键。现有的LLM主要利用各种公共文本数据集的混合作为预训练语料库,语料库内容有网页、对话数据、书籍和新闻、科学数据、代码等等。
预训练的模型需要经过调优来获得更好的特定性能。经过预训练,LLMs 可以获得解决各种任务的通用能力。然而越来越多的研究表明,LLMs 的能力可以根据具体目标进一步调整,调整预训练 LLMs 的两个主要方法,即指令调优和对齐调优。前一种方法主要是为了提高或解锁 LLMs 的能力,而后一种方法则是为了使 LLMs 的行为与人类的价值观或偏好一致。
1)指令调优可以提升大模型在金融领域对专业性问题的理解能力。本质上,指令调优是在自然语言形式的格式化实例集合上微调预训练 LLMs 的方法,这与监督微调和多任务提示训练高度相关。在指令调优后,LLMs 可以展示出卓越的能力,泛化出能解决未见任务的能力,即使在多语言环境中也是如此。我们认为,在拥有金融领域的适当数据的情况下,指令调优可以使得大语言模型产生对金融领域专业性问题的理解能力。
2)对齐调优有望保证金融行业大模型落地的合规性。LLM在广泛的NLP任务中表现出卓越的能力。然而,这些模型有时可能表现出非预期的行为,例如捏造虚假信息,追求不准确的目标,并产生有害的、误导性的和有偏见的表达。为了避免这些意想不到的行为,已经提出了通过人类进行对齐调优,以使LLM的行为符合人类的期望。我们认为,对齐调优有望保证金融行业大模型的输出内容合理合规。
03
金融IT公司:业务理解与训练数据构成AI核心竞争力根据我们之前外发报告《同花顺AI产品调研(B端):iFind渗透率有望进一步提升,受访者对AI发展期待度较高》的调研数据,机构用户对金融AI软件仍有更高期待,场景主要是工作简化、智能投研等。从 B 端客户需求出发,我们将 AI 赋能的方向划分为工作简化、智能投研、智慧投资、算法交易等,绝大多数投资者将(89.6%)工作简化(如报表生成、数据提取等)作为主要期待,而智能投研(如财报语义和情感分析等)也占了相当比重。
我们认为,从准确性与可用性两个角度考虑,数据与对下游行业knowhow的理解构成金融GPT的核心竞争力。1)服务于准确性,我们认为训练数据的质量与数量构建成为金融领域大模型应用的核心竞争力。参考BloombergGPT,该模型依托彭博社的大量金融数据源,构建了一个3630亿个标签的数据集,支持金融行业内的各类任务,在执行金融任务上的表现远超过现有模型,在通用场景上的表现与现有模型也能一较高下。而BloombergGPT能在金融任务执行上弯道超车,主要由于彭博是金融数据公司,他们的数据分析师已经花了四十多年的时间收集、制作金融语言文件。他们拥有广泛的金融数据档案,涵盖了一系列的主题,并仔细跟踪数据来源和使用权。他们将这些数据添加到公共数据集中,以创建一个拥有超过 7000 亿个 token 的大型训练语料库。 2)服务于可用性,基于对业务的理解基础,对产品进行AI赋能,保证了应用软件最终的可用性。参考Copilot,微软作为办公套件全球龙头,在Microsoft 365完整的生态与成熟产品的基础上推出Microsoft 365 Copilot,是对产品能力的一次革命性升级。但假设没有过去对于办公套件产品的积累与生态建设,直接推出新生产力工具,那么从用户基础,到产品交互设计(何处以哪种方式嵌入gpt能力),均需要一个很长的打磨过程。金融IT厂商有望通过对业务的理解能力构成入局GPT之矛,在大模型的助力下实现现有产品价值量的跨越式提升。在软件能力从企业的辅助工具走向企业核心竞争力的背景下,构筑自身新增张。现有金融IT厂商持续通过样本程序、技术文档、知识图谱、领域知识,以及项目管理、实施及质量控制等方式实现行业know-how的积累。知识图谱、领域知识可以转化为训练数据,实现金融GPT的垂直行业训练。结合对原有产品的理解升级,有望让产品的使用场景贴合用户痛点。
在数据+业务理解能力双重占优的背景下,我们判断头部金融IT厂商有望受益于本轮技术革新,构筑新一轮的成长。彭博社发布的BloombergGPT显示出金融界大模型的应用潜力。而受益于金融IT基于AI的应用基础,以及明确的市场需求潜力,我们认为金融领域的GPT革命或刚刚开始。
建议关注金融IT相关标的:ToB:保险IT:中科软、恒生电子、新致软件等。证券IT:恒生电子、顶点软件、金证股份等。银行IT:长亮科技、京北方、宇信科技、软通动力、神州信息等。ToC:同花顺、东方财富(海外&传媒组覆盖)、指南针、财富趋势等。04
风险提示1)AI应用落地不及预期:若AI相关应用的落地不及预期,相关公司或将受到影响;2)金融GPT进展不及预期:如果GPT在金融领域的发展不及预期,或部署落地情况不及预期,相关公司或将受到影响;3)大模型进展不及预期:GPT系受到国内外广泛关注,国内加速国产大模型研发,若后续研发进展及应用不及预期,相关公司或将受到影响。注:文中报告节选自天风证券研究所已公开发布研究报告,具体报告内容及相关风险提示等详见完整版报告。
证券研究报告:《金融GPT系列二:挖掘垂直场景数据,2B金融GPT是一片新蓝海》对外发布时间 2023年4月17日报告发布机构 天风证券股份有限公司(已获中国证监会许可的证券投资咨询业务资格)本报告分析师:缪欣君 SAC 执业证书编号:S1110517080003