金融的大模型时代!技术路径是什么?海内外又有哪些应用?| 智库
推荐阅读 AI与金融的结合主要有两条技术路径,分别是通过金融语料训练的金融大模型和金融垂类大模型。双方优劣具有相对性,而通用大模型通过金融语料训练超越金融垂类模型可能性较小。 在金融垂类模型上,国外彭博BloombergGPT率先登场;国内金融垂类模型百花齐放,例如恒生电子进一步升级金融大模型LightGPT,东方财富、同花顺加大AI研发技术投入等。 目前各家公司都在致力于以大模型赋能股基APP或是金融终端,为已有功能注入AI能力,实现多场景应用。在金融科技支持政策陆续出台、海外金融垂类模型加速落地的背景下,我们认为,金融垂类模型将成为金融科技领域未来的发展重点。 来源:新财富杂志(ID:xcfplus) 作者:胡翔(东吴证券非银行金融首席分析师)武欣姝(东吴证券非银行金融研究组研究员) 当前,国内互联网企业、传统金融机构及金融科技企业争相竞逐,“百模大战”如火如荼,AI与金融的结合也日益深化。 01 国内外大模型现状:OpenAI、微软引领业界,国内多家企业推出产品 国外AI通用大模型案例中,OpenAI&微软、谷歌等都推出了相关模型。其中,OpenAI携手微软,ChatGPT4-Turbo业界领先。谷歌则是框架领先,模型丰富,应用偏弱。而亚马逊云(AWS)领跑AIGC,推出Titan大语言模型。 国内方面,多家企业推出相关产品。 百度具备先发优势,文心大模型国内领先。文心一言目前已拥有7000万用户。4.0版本能力栈较为广泛,可应用的场景较多,在查询搜索知识应用等方面表现不俗。阿里发布通义千问2.0,专业能力较强。可应用于相对复杂的场景。 从国内外通用AI大模型的发展历程来看,发展趋势是国外领先,国内紧追。 综合表现上,头部模型国外领先,平均水平国内外差距较小。所有模型中,GPT4-Turbo遥遥领先,国内最好的大模型为百度文心一言,但二者仍有一定差距。国产大模型虽与国外有所差距,但平均水平上与国外差距并不明显。此外,国内开源大模型在中文上的表现要优于国外开源大模型。 而在金融领域上,通用大模型的应用表现各有差异。 在国外,GPT系列在金融领域表现较好。GPT系列能较好理解金融术语,解答金融相关问题,且具备一定的实时性,在金融领域能够自动生成金融报告、做市场研究等。 在国内,百度文心、阿里通义千问、腾讯混元以及科大讯飞在金融领域表现较好。百度文心一言具备较高的实时性,能够在多项金融相关工作中发挥作用。阿里通义千问能够较好的解释金融概念,但存在时效性限制。腾讯混元可以优化金融服务的个性化体验、市场情绪的追踪等。科大讯飞星火则将语音识别和处理技术用于交易系统、智能财经助手等。 02 AI金融竞争:百模大战如火如荼,两条技术路线各有千秋 国内互联网企业、传统金融机构及金融科技企业争相竞逐,当前竞争较为白热化。2023年5月中旬,奇富科技首先宣布推出金融行业通用大模型奇富GPT,号称“国内首个金融行业通用大模型”。2023年5月,度小满推出国内首个千亿级中文金融大模型“轩辕”。恒生电子于2023年6月发布了金融大模型LightGPT,并对其进行升级,形成“LightGPT+WarrenQ+光子”体系。2023年9月7日和9月8日,腾讯混元大模型和蚂蚁金融大模型相继正式亮相。2023年11月,幻方量化旗下DeepSeek推出DeepSeek LLM 67Bt,相较于其他金融模型拥有更突出的推理、数学、编程等能力。2024年开年之初,同花顺和东方财富分别推出问财HithinkGPT和妙想金融大模型。 图表:国内金融垂类AI模型发布时间及发布机构 当前AI与金融的结合主要有两条技术路径,一是通用模型和金融语料训练融合的金融大模型,二是金融垂类大模型。那么,通用和金融融合的大模型与金融垂类大模型相比,优劣势各是什么? 由于设计和训练目的不同,通用语言大模型与金融垂类模型在优劣上具有相对性。通用语言大模型在泛用性、灵活性、数据利用率、迁移性上相比金融垂类更有优势,而在专业性、针对性、高精度和合规性上,金融垂类模型更胜一筹;在复杂度问题上,通用语言大模型在结构上更加复杂,金融垂类模型则在更新维护上具有复杂性。 图表:通用与金融垂类大模型优劣对比 两种模型相比,通用金融模型经过训练超越金融垂类模型的可能性较小。 首先,使用金融数据对通用大模型进行训练,数据欠缺,成本过高。金融领域的语料应该充分覆盖各种金融产品、市场情况和业务流程等。通用大模型缺少金融数据进行训练,金融专业知识不足;另外,如果从底层开始训练大模型,需要投入的算力成本非常高。 其次,在特定任务上,通用大模型精确性与适用性欠缺。金融垂类大模型会投入大量的时间和资源来收集和整理金融领域的专业知识。通用语言模型虽然可以通过金融语料的训练来提高在这方面的能力,但是否能达到金融垂类大模型的专业性仍有待验证。 第三,金融领域要求实时性和高效的推理速度。金融垂类大模型会针对这一需求进行优化,以缩短响应时间。通用语言大模型在处理金融领域的实时应用时可能需要进一步优化。 第四,金融领域对合规性和风险控制要求极高。金融领域对于数据保护、隐私和风险控制具有严格的要求,专门训练的金融垂类大模型可能会更好地满足这些合规性需求。 度小满CEO许东亮曾表示:“通用模型难以胜任金融领域任务,金融大模型是大模型落地金融行业的必由之路”。 03 国内外通用大模型在金融领域的应用表现 金融大模型始于BloombergGPT,当前国内外金融行业都在主动拥抱大模型。国际数据公司IDC的一项调研显示,超半数的金融机构计划在2023年投资生成式人工智能技术。包括BloombergGPT在内,国外已出现了一系列金融大模型。而国产金融大模型也分出了两大“流派”,一派来自于传统金融机构,另一派来自于金融系科技企业或互联网企业。 从国内外案例来看,彭博BloombergGPT率先登场,金融任务的表现远超通用模型。 2023年3月底,彭博构建了最大的特定领域数据集,并训练了专门用于金融领域的大语言模型(LLM),开发了拥有500亿参数的语言模型BloombergGPT。BloombergGPT的混合训练方法使其模型在金融任务上的表现大大超过了现有的大语言模型,而在通用场景上的表现则与之相当,甚至优于现有模型。 彭博BloombergGPT相比于通用大模型的优势在于,该模型对金融领域理解更为深刻,具有深度专业的分析能力,同时通过协助优化金融自然语言处理(NLP)任务,提升彭博终端数据的应用价值,开辟金融行业分析和决策的新可能性。 在这之后,AI4Finance Foundation开发了FinGPT这个金融领域的语言模型。FinGPT采用以数据为中心的方法,强调了数据采集、清理和预处理在开发开源FinLLM中的关键作用。通过支持数据可访问性,FinGPT渴望加强金融领域的研究、合作和创新,为开放金融实践铺平道路。FinGPT的最后一个组成部分是应用层,旨在展示FinGPT的实际适用性。它为金融任务提供实践教程和演示应用程序,包括机器人咨询服务、量化交易和低代码开发。 LLMS层处于核心位置,它包含各种微调方法,优先考虑轻量级适应,以保持模型的更新和相关性。数据处理层专注于NLP数据的实时处理,以应对金融数据固有的高时间敏感性和低信噪比的挑战。FinGPT管道的起点是数据源层,它协调从各种在线资源中获取大量财务数据。 国内金融垂类模型也有一些经典案例。 恒生电子的LihgtGPT金融行业大模型,是一个更专业、更合规、更轻量的模型。LightGPT拥有更专业的金融语料积累处理和更高效稳定的大模型训练方式。在金融专业问答、逻辑推理、超长文本处理能力等在内的金融大模型能力评测中均有不错表现,能保证内容和指令的合规安全,可以为多种金融业务场景提供底层AI能力支持。 其中,光子系列产品是基于LightGPT能力,致力于在合规审核、投研算法、客户服务和营销分析方面成为金融从业人员的智能助手。 WarrenQ系列产品则是一款投研效率工具产品,旨在提高研究员的工作效率和实现知识高效协同。基于大模型叠加搜索和金融数据库,通过对话指令,可轻松获得金融行情、资讯和数据,且每一句生成的对话均支持文本溯源。ChatMiner可以帮助快速提取文档中的信息,提供精准检索与定位,精炼或拓展文本。...