金融的大模型时代!技术路径是什么?海内外又有哪些应用?| 智库

金融的大模型时代!技术路径是什么?海内外又有哪些应用?| 智库推荐阅读金融的大模型时代!技术路径是什么?海内外又有哪些应用?| 智库

金融的大模型时代!技术路径是什么?海内外又有哪些应用?| 智库

金融的大模型时代!技术路径是什么?海内外又有哪些应用?| 智库

AI与金融的结合主要有两条技术路径,分别是通过金融语料训练的金融大模型和金融垂类大模型。双方优劣具有相对性,而通用大模型通过金融语料训练超越金融垂类模型可能性较小。

在金融垂类模型上,国外彭博BloombergGPT率先登场;国内金融垂类模型百花齐放,例如恒生电子进一步升级金融大模型LightGPT,东方财富、同花顺加大AI研发技术投入等。

目前各家公司都在致力于以大模型赋能股基APP或是金融终端,为已有功能注入AI能力,实现多场景应用。在金融科技支持政策陆续出台、海外金融垂类模型加速落地的背景下,我们认为,金融垂类模型将成为金融科技领域未来的发展重点。

来源:新财富杂志(ID:xcfplus)

作者:胡翔(东吴证券非银行金融首席分析师)武欣姝(东吴证券非银行金融研究组研究员)

  金融的大模型时代!技术路径是什么?海内外又有哪些应用?| 智库

当前,国内互联网企业、传统金融机构及金融科技企业争相竞逐,“百模大战”如火如荼,AI与金融的结合也日益深化。

01

国内外大模型现状:OpenAI、微软引领业界,国内多家企业推出产品

国外AI通用大模型案例中,OpenAI&微软、谷歌等都推出了相关模型。其中,OpenAI携手微软,ChatGPT4-Turbo业界领先谷歌则是框架领先,模型丰富,应用偏弱。而亚马逊云(AWS)领跑AIGC,推出Titan大语言模型。

国内方面,多家企业推出相关产品。

百度具备先发优势,文心大模型国内领先。文心一言目前已拥有7000万用户。4.0版本能力栈较为广泛,可应用的场景较多,在查询搜索知识应用等方面表现不俗。阿里发布通义千问2.0,专业能力较强。可应用于相对复杂的场景。

从国内外通用AI大模型的发展历程来看,发展趋势是国外领先,国内紧追。

综合表现上,头部模型国外领先,平均水平国内外差距较小。所有模型中,GPT4-Turbo遥遥领先,国内最好的大模型为百度文心一言,但二者仍有一定差距。国产大模型虽与国外有所差距,但平均水平上与国外差距并不明显。此外,国内开源大模型在中文上的表现要优于国外开源大模型。

而在金融领域上,通用大模型的应用表现各有差异。

在国外,GPT系列在金融领域表现较好。GPT系列能较好理解金融术语,解答金融相关问题,且具备一定的实时性,在金融领域能够自动生成金融报告、做市场研究等。

在国内,百度文心、阿里通义千问、腾讯混元以及科大讯飞在金融领域表现较好。百度文心一言具备较高的实时性,能够在多项金融相关工作中发挥作用。阿里通义千问能够较好的解释金融概念,但存在时效性限制。腾讯混元可以优化金融服务的个性化体验、市场情绪的追踪等。科大讯飞星火则将语音识别和处理技术用于交易系统、智能财经助手等。

02

AI金融竞争:百模大战如火如荼,两条技术路线各有千秋

国内互联网企业、传统金融机构及金融科技企业争相竞逐,当前竞争较为白热化。2023年5月中旬,奇富科技首先宣布推出金融行业通用大模型奇富GPT,号称“国内首个金融行业通用大模型”。2023年5月,度小满推出国内首个千亿级中文金融大模型“轩辕”。恒生电子于2023年6月发布了金融大模型LightGPT,并对其进行升级,形成“LightGPT+WarrenQ+光子”体系。2023年9月7日和9月8日,腾讯混元大模型和蚂蚁金融大模型相继正式亮相。2023年11月,幻方量化旗下DeepSeek推出DeepSeek LLM 67Bt,相较于其他金融模型拥有更突出的推理、数学、编程等能力。2024年开年之初,同花顺和东方财富分别推出问财HithinkGPT和妙想金融大模型。

图表:国内金融垂类AI模型发布时间及发布机构

金融的大模型时代!技术路径是什么?海内外又有哪些应用?| 智库

当前AI与金融的结合主要有两条技术路径,一是通用模型和金融语料训练融合的金融大模型,二是金融垂类大模型。那么,通用和金融融合的大模型与金融垂类大模型相比,优劣势各是什么?

由于设计和训练目的不同,通用语言大模型与金融垂类模型在优劣上具有相对性。通用语言大模型在泛用性、灵活性、数据利用率、迁移性上相比金融垂类更有优势,而在专业性、针对性、高精度和合规性上,金融垂类模型更胜一筹;在复杂度问题上,通用语言大模型在结构上更加复杂,金融垂类模型则在更新维护上具有复杂性。

图表:通用与金融垂类大模型优劣对比

金融的大模型时代!技术路径是什么?海内外又有哪些应用?| 智库

两种模型相比,通用金融模型经过训练超越金融垂类模型的可能性较小。

首先,使用金融数据对通用大模型进行训练,数据欠缺,成本过高。金融领域的语料应该充分覆盖各种金融产品、市场情况和业务流程等。通用大模型缺少金融数据进行训练,金融专业知识不足;另外,如果从底层开始训练大模型,需要投入的算力成本非常高。

其次,在特定任务上,通用大模型精确性与适用性欠缺。金融垂类大模型会投入大量的时间和资源来收集和整理金融领域的专业知识。通用语言模型虽然可以通过金融语料的训练来提高在这方面的能力,但是否能达到金融垂类大模型的专业性仍有待验证。

第三,金融领域要求实时性和高效的推理速度。金融垂类大模型会针对这一需求进行优化,以缩短响应时间。通用语言大模型在处理金融领域的实时应用时可能需要进一步优化。

第四,金融领域对合规性和风险控制要求极高。金融领域对于数据保护、隐私和风险控制具有严格的要求,专门训练的金融垂类大模型可能会更好地满足这些合规性需求。

度小满CEO许东亮曾表示:“通用模型难以胜任金融领域任务,金融大模型是大模型落地金融行业的必由之路”。

03

国内外通用大模型在金融领域的应用表现

金融大模型始于BloombergGPT,当前国内外金融行业都在主动拥抱大模型。国际数据公司IDC的一项调研显示,超半数的金融机构计划在2023年投资生成式人工智能技术。包括BloombergGPT在内,国外已出现了一系列金融大模型。而国产金融大模型也分出了两大“流派”,一派来自于传统金融机构,另一派来自于金融系科技企业或互联网企业。

从国内外案例来看,彭博BloombergGPT率先登场,金融任务的表现远超通用模型。

2023年3月底,彭博构建了最大的特定领域数据集,并训练了专门用于金融领域的大语言模型(LLM),开发了拥有500亿参数的语言模型BloombergGPT。BloombergGPT的混合训练方法使其模型在金融任务上的表现大大超过了现有的大语言模型,而在通用场景上的表现则与之相当,甚至优于现有模型。

彭博BloombergGPT相比于通用大模型的优势在于,该模型对金融领域理解更为深刻,具有深度专业的分析能力,同时通过协助优化金融自然语言处理(NLP)任务,提升彭博终端数据的应用价值,开辟金融行业分析和决策的新可能性。

在这之后,AI4Finance Foundation开发了FinGPT这个金融领域的语言模型。FinGPT采用以数据为中心的方法,强调了数据采集、清理和预处理在开发开源FinLLM中的关键作用。通过支持数据可访问性,FinGPT渴望加强金融领域的研究、合作和创新,为开放金融实践铺平道路。FinGPT的最后一个组成部分是应用层,旨在展示FinGPT的实际适用性。它为金融任务提供实践教程和演示应用程序,包括机器人咨询服务、量化交易和低代码开发。

LLMS层处于核心位置,它包含各种微调方法,优先考虑轻量级适应,以保持模型的更新和相关性。数据处理层专注于NLP数据的实时处理,以应对金融数据固有的高时间敏感性和低信噪比的挑战。FinGPT管道的起点是数据源层,它协调从各种在线资源中获取大量财务数据。

国内金融垂类模型也有一些经典案例。

恒生电子的LihgtGPT金融行业大模型,是一个更专业、更合规、更轻量的模型。LightGPT拥有更专业的金融语料积累处理和更高效稳定的大模型训练方式。在金融专业问答、逻辑推理、超长文本处理能力等在内的金融大模型能力评测中均有不错表现,能保证内容和指令的合规安全,可以为多种金融业务场景提供底层AI能力支持。

金融的大模型时代!技术路径是什么?海内外又有哪些应用?| 智库

其中,光子系列产品是基于LightGPT能力,致力于在合规审核、投研算法、客户服务和营销分析方面成为金融从业人员的智能助手。

WarrenQ系列产品则是一款投研效率工具产品,旨在提高研究员的工作效率和实现知识高效协同。基于大模型叠加搜索和金融数据库,通过对话指令,可轻松获得金融行情、资讯和数据,且每一句生成的对话均支持文本溯源。ChatMiner可以帮助快速提取文档中的信息,提供精准检索与定位,精炼或拓展文本。

恒生电子的LightGPT和WarrenQChat产品优势有三方面。一是金融领域生成能力强。基于2000亿中文tokens的加持,超过80个中文金融任务的打磨,可覆盖了金融绝大多数领域应用场景,针对性强,回答速度极快,准确率较高,并支持多种语言输入与输出。二是合规性、安全性高。充分学习中国的金融法律法规,在输出时符合中国金融市场的监管要求。三是轻量化。支持私有化或云部署以及灵活API调用,推理端仅需一机2卡部署。金融机构可以打造机构专属大模型,满足个性化需求。

东方财富则重磅打造妙想金融大模型,致力于满足各类金融场景需求。

妙想金融大模型,使用Decoder-only的Transformer网络结构,支持32K的上下文长度,满足各类金融场景下的需求。通过自建的数据治理和数据实验流程,结合效果预估算法、高效预训练框架、SFT、RLHF训练等技术,妙想金融大模型建立起自主研发的技术壁垒。目前,妙想金融大模型已经可以分别适配不同的应用场景,提高模型应用的效费比。

金融的大模型时代!技术路径是什么?海内外又有哪些应用?| 智库

妙想金融大模型优势有四点。一是多场景赋能,功能覆盖面广。妙想金融大模型发力投研、投顾等金融核心场景,基于多种用户场景痛点,对智能问答和智能投研场景进行了个性化的功能设计,提供数百种场景解决方案。二是高性能推理支撑场景需求。妙想金融大模型通过量化、模型算子优化等措施极大提高了速度,结合Paged Attention、C张量并行推理等技术优化推理框架的性能,算力的利用率提高了数倍。三是高品质金融数据供给。东方财富拥有海量用户资源,多元的金融业务场景,已经构建了完备行业通用数据集,并将持续丰富。四是实时性较强,并且能精准溯源。可以进行当天股票分析并给出来源,同时可助力研究员倍速完成研报阅读、挖掘研报信息、总结梳理要点并精准溯源。

同花顺在PC端、手机端双边发力,打造多场景应用AI功能集合。

2023年12月6日,同花顺开启了问财升级版的内测,底层已经升级为Hithink GPT大语言模型,结合海量金融领域数据和知识,通过自然语言对话,协助投资者进行标的选择、标的诊断等全方位投顾服务。基于超过3000万的月活流量,以及B端产品iFind业务的快速增长,同花顺大模型有丰富的落地场景。

当前,iFinD产品实现了基于语音交互与智能搜索服务、机器阅读研报、研报知识图谱自动生成等一整套智能化解决方案,预计iFinD+大模型将结合基础功能补齐,性价比优势有望引领中期份额突破;同花顺AI开放平台目前可面向客户提供多项AI产品及服务。

金融的大模型时代!技术路径是什么?海内外又有哪些应用?| 智库

Ai FinD优势在于三个方面。一是金融数据覆盖面广。同花顺利用十几年的数据积累以及市场上公开的金融数据,预训练金融语料达到万亿级tokens,每月可新增数千亿tokens优质预训练数据以及数十万条优质微调数据,同时拥有一套自动化的流程,用于数据获取、清洗以及数据质量的验证。二是模型训练创新优化。构建了包括数据配比实验方案、scaling law实验体系、模型架构优化等科学高效的大模型训练体系,能以更低的训练成本高效地完成HithinkGPT大模型家族的训练。三是实时性较强AiFinD中先进大模型叠加iFinD平台自身拥有的金融数据库以及各类实时信息,可以通过对话指令获取实时数据和信息,并注明来源,相较于其他大模型具有更强的实时性和真实性。

04

投资机会:金融垂类模型百花齐放,技术领先、数据丰富的企业将持续受益

在金融科技支持政策陆续出台、海外金融垂类模型加速落地的背景下,金融垂类模型将成为金融科技领域未来的发展重点。一方面资本市场偏宽松政策环境,叠加财富管理行业科技赋能趋势,使得金融T行业面临确定性需求提升趋势,且AIGC的推广也将引领金融行业相关的产业革命;另一方面,AIGC自身发展前景广阔,产业投资正在持续涌入。

伴随着金融大模型应用的不断深化和拓展,当下金融大模型已经不局限于文本生成和虚拟客服等领域,而是开始广泛应用于金融资讯发布、产品介绍内容创作等。展望未来,随着更多的金融大模型陆续落地,将采用更加精细化处理行业细分场景,同时孕育出新的应用场景,为传统业务注入新活力,也为金融领域带来新的业务机会。这将全面提升金融服务的效能,推动金融业务生态的全面重塑,为金融行业持续的前进和革新铺平道路。

我们认为,2024年金融垂类AI大模型将迎来前所未有的蓬勃发展,形成一番百花齐放的景象。而具备AI模型技术领先优势、较大金融交易数据基础、较好应用场景入口、积极推进AI模型构建的金融科技企业将持续受益。

– END –

本文所提及的任何资讯和信息,仅为作者个人观点表达或对于具体事件的陈述,不构成推荐及投资建议,不代表本社立场。投资者应自行承担据此进行投资所产生的风险及后果。

杂志购买请回复关键词【杂志】获取购买链接,购买3月杂志请回复关键词【3月杂志】获取链接,其他月份以此类推。