AI金融助手
目录 01. 引言 02. AI+金融:特点 03. AI在金融场景中的角色探索 04. AI+金融:挑战与展望 05. 总结 06. 参考文献 引言全球对人工智能的兴趣激增,在大洋彼岸的人工智能狂热中,如人工智能初创公司Inflection完成逾十亿美元的融资,同样规模的融资也发生在初创公司MosaicML ,以逾十亿美元被Databricks所收购。在金融领域,OpenAI等人工智能厂商在过去数周继续主导着国外金融市场的AI新闻。穆迪携手微软和OpenAI合作,推出AI助手,帮助客户评估风险。瑞穗银行让员工使用Azure OpenAI,成为日本首家采用该技术的金融公司。然而,如光锥智能(2023)所描述,“资本市场一冷一热所折射的,正是身处发展初期的中国AIGC产业,面对商业模式不清晰、技术层面的不足,大批国内创业者仍征途漫漫”,尽管人工智能已成为科技领域的投资热点,但国内市场对人工智能的态度似乎从近几个月中国初创企业的爆炸性增长的景象慢慢发生了改变,在算力发展受限等新的限制下,国内AIGC赛道的发展又将面临新的挑战。AI创业者将在金融赛道中看到的,可能不仅是机会,其中也会看到行业中存在的特定门槛,以及一些面临的挑战。从年初到现在,非凡产研持续与AI赛道创业者及投资人保持深度交流和交易参与,并有幸采访到摸象科技、有连云、飞笛科技、熵简科技、深擎科技等在AI赛道中的优秀企业,探讨他们在金融行业中的经验和认知。本文将从AI与金融场景结合的角度,结合访谈内容,探讨AI赛道中金融领域的独特性,体系化地呈现这些公司如何利用AI在金融赛道实现价值。AI+金融:特点 • AI与金融场景的结合,是金融科技的具象体现 • 关于AI与金融的结合,中国人民银行2019年发布的《关于金融科技(FinTech)发展规划(2019-2021年)》中描述,金融科技属于金融与科技的深度融合。深度研发信息技术、人工智能、大数据、区块链等科技,并创造性使用,金融科技将在金融市场优化、服务水平提升、服务领域拓宽,及风险防范中发挥关键角色。作为基于技术带来的金融创新,金融科技具有颠覆业务模式、业务、流程与产品的潜力。人工智能与机器学习过去主要服务于金融行业的信用评估和基础欺诈评分。新一代人工智能通过大型语言模型(LLM)处理非结构化数据能力和强大的算力,已为众多行业带来前所未有的赋能。一方面,金融行业、机构及公司拥有庞大的、覆盖多行业的历史数据,为训练行业模型提供了坚实的基础。然而另一方面,出于信息安全及合规的需要,金融行业往往更为谨慎。目前,在金融行业的数字化转型的进程中,人工智能充当着日益重要的角色。作为目前集合庞大、广度深、复杂度且增长快速的技术学科,人工智能与金融场景的融合,可以说是金融科技的最具象体现。金融科技中的人工智能是利用人工智能进行金融数据分析、客户服务、供应链管理、交易建议等诸多领域的应用(Editorial Team,2023)。据The Business(2023)统计,全球金融科技领域的人工智能市场规模从2022年的91.5亿美元增长到2023年的115.9亿美元,年复合增长率(CAGR)为26.8%,预计金融科技领域的人工智能市场规模将在2027年达到317.1亿美元,年复合增长率为28.6%。AI创业者将在金融赛道中看到的,可能不仅是机会,其中还包括行业中存在的特定门槛以、未来的挑战。 • AI与金融场景的结合,有它特定的门槛 • AI与金融场景的结合,有它特定的门槛,具体体现在人才、数据及技术壁垒、信息安全与合规等维度。2.1 关于人才AI与金融结合,不仅需要复合型人才,还对业务Knowhow有一定要求,以便更好地理解金融行业的逻辑和需求,这也是人才门槛的主要体现。在专业水平方面,AI与金融结合不仅要求AI具备足够的领域专业度,还要求人具备金融知识、金融工程、投资等方面的专业知识。从专业度角度,飞笛科技丘慧慧表示,金融价值一方面体现在其让实体经济获得资金的支持,让实体经济得到持续增长;另一方面让资金的持有方合理投放,保持资产增值。从专业性角度,金融行业是信息行业中专业度、场景密度及频次都最深的行业,金融本身不直接创造价值,但它会赋能实体经济,它本身的价值是资金使用效率提高赋能实体经济、让资产保持增值,因此对团队及人才的专业度有一定要求。从人才的复合角度,熵简科技费斌杰表示,AI在金融领域面临的核心挑战还是在人才端。这个行业需要更多的专业复合型人才,不仅对实战投研与数据科学知识的深度结合有较高要求,还要懂数据,比如具备调用模型、写Spark、Flink等技能。然而,这种级别的复合人才在市场上并不多。此外,相比人才的数量,质量可能更为重要,比如打造出优秀产品的OpenAI,其团队人数其实并不多,但每位成员都是超级复合型专家。这种顶级的跨领域深度复合人才,是推动企业乃至整个行业发展的关键,而这种顶级人才的竞争也是最激烈的。从专业与业务结合角度,有连云张岩阐述了AI技术应用与细分领域产品落地的关系。一方面金融领域对专业度要求较高,创业公司的团队构建往往需要懂金融且有技术开发背景的架构师等人才。另一方面,产品的落地需要技术与场景理解相结合,这要求团队能了解客户需求、并能够针对性地解决业务开展过程中的困难。其次,基于对业务的理解调整对应分工是充分发挥复合型人才的潜能的关键。2.2 数据、技术壁垒&信息安全与合规数据壁垒方面,金融行业的数据质量要求非常高,数据的准确性直接影响到金融决策的结果。AI需要能够从大量的数据中提取出有价值的信息,同时还需要确保数据的准确性和完整性。其次,金融行业的数据涉及到用户的隐私,因此数据的安全和隐私保护至关重要。此外,AI应用过程中,数据获取与合规也是备受关注的问题,其要求AI需要在合规的前提下获取和处理数据,确保数据的合法使用。熵简科技创始人费斌杰以模型训练为例,表示每个行业的私域知识对于训练领域大模型是最重要且不可或缺的因素,也是垂直模型在特定领域领先于通用模型的原因。如GPT-3的训练主要是包含common crawl等在内的数据集,然而这些通过公开的网站、渠道获得的数据集却很难满足于构建一个专业的数据库的要求。此外,这些私域资料的质量也分层级,训练模型的对这些数据的筛选和加工也有很高的要求。*common crawl:Common Crawl语料库包含通过12年的网络爬取收集的数千亿字节的数据。该语料库包含原始网页数据、元数据提取和文本提取。Common Crawl数据存储在Amazon Web Services的公共数据集以及全球多个学术云平台上。(OpenDataLab,2019,available from:https://opendatalab.com/Common_Crawl)技术壁垒方面,金融领域涉及大量的数据,包括股票市场数据、宏观经济数据、用户交易数据等。AI需要具备高效地处理和分析这些数据的能力。同时,基于大模型的技术底座,AI能更好理解金融领域的业务逻辑和数据结构,以便为金融机构提供准确、有效的解决方案。然而,金融场景下的AI模型需要在实际应用中不断进行优化和验证,这都需要专业的算法工程师和数据科学家去确保模型的稳定性和准确性。在信息安全与合规方面,飞笛科技丘慧慧从AI应用在内容科技业务的角度,阐述了信息准确度在传播过程中的重要性。金融领域具有其独特性,因其关乎国民财富的安全和收益,故而须受到严格的监管。在此背景下,容错率相对较低,这也意味着,如果机器或AI系统不能确保信息的准确性和来源的权威性,合规性将面临极大挑战。而在具体内容科技业务中,信息来自于对风险的识别和对机会的判断,包括对产业、公司的理解。在综合的传播环境下及传递的过程中,信息会发生发酵,产生共振,但同时,信息既可以引导价值和拉动需求,又可能被误解从而形成市场震荡。因此,信息、资金是影响、驱动整个金融市场的核心。且信息和资金流是互相影响的,专业性要求很高,每天瞬息万变,金融对信息的及时性要求非常高,也是它的一个门槛。深擎科技柴志伟表示,出于对金融行业独特性、数据安全及合规性的重视,中国的厂商在考虑海外大型模型在国内的应用时,表现得相对审慎。选择私有化部署的垂直领域模型,已经在AI模型层在金融领域发展成为一种趋势。金融机构对于通用大模型的运用,主要目标在于提升认知,然而,通用大模型的参数可能高达千亿级别,但垂直领域的模型参数可能仅需百亿。因此,私有化部署的要求仍然依赖垂直领域模型。在私有化部署方面,摸象科技高鹏表示,对于银行客户,出于隐私安全及数据监管的需求,一般行方会要求AI厂商提供私有化部署,即以私有云的方式替代公共云服务。这将对我工程产品开发带来较大的挑战。持续改进产品的性能,使其更容易运营和维护,从而降低私有化部署中的工程运维成本是AI厂商的工程团队所需要做的事情。有连云张岩介绍道,构建一个具备专业能力并符合低容错度要求的模型是富有挑战性的,它需要耗费大量的研发资源并进行反复的模型迭代和升级。金融领域的独特之处在于,金融领域对数据的时效性、准确性和稳定性要求很高,模型的数据时效性、准确性与稳定性对用户体验与客户黏性起着重要作用。对于数据安全及合规,熵简科技费斌杰表示,在金融领域,对人工智能模型的高度可靠性要求极为重要。AI模型在行业应用中的最后一公里正是其可靠性的问题。监管对于金融行业的厂商来说,并非一个需要战胜的挑战,而是一个引导性的框架、一个市场竞争的规则,以及一个行业的规定。为了符合监管要求并处理数据合规性,有许多可行的方法,例如发展开源模型将为整个行业带来福利,或者将模型部署在国家托管的监管云之上并为金融机构提供服务,此外,为金融机构在本地部署服务,也是值得考虑的一个方向。这些因素都有助于提高AI在金融行业应用中的可靠性。随着经网信办审议通过,并经发改委及相关部门同意于今年8月15日起施行的《生成式人工智能服务管理暂行办法》已将网络信息内容生产者的服务规范列入技术发展与治理要求当中,未来,对于AI的信息安全将会有更明确的框架规范与要求。总体来说,AI与金融结合的门槛主要体现在技术门槛、数据门槛、人才门槛和法规门槛等方面。只有克服这些门槛,才能充分发挥AI在金融领域的优势,为金融机构提供更加智能化的解决方案。AI在金融场景中的角色探索 • 主流技术及应用 • 目前AI在金融领域底层技术主要以NLP(Natural Language Processing自然语言处理技术)、“大型语言模型”(LLM,Large Language Model)、数据挖掘、数据加工(非/半结构化)等。艾瑞咨询(2022)把AI+金融的分为前、中、后台,分别从智慧营销、信用评估到模型开发及大数据层面,从机器学习及智能语音等维度剖析AI在银行、保险、证券等领域的具体角色。*LLM,Large Language Model一种通过分析亿级规模的语言数据或视觉素材,以进行知识提炼和模型学习的过程,最终构建出庞大参数量级的大型模型。在金融环境中,AI能够通过多种途径展现其效能。首先,在风险控制方面,AI可以对大量数据进行分析,协助金融机构进行风险评估并制定相应策略。例如,通过对客户的信用评分、交易记录、财务状况等信息的分析,AI可以为客户提供定制化的金融产品和服务。在投资研究方面,AI能够通过对历史数据的分析,为投资者提供行业和股票的预测和建议。此外,AI还能够在量化交易领域发挥作用,通过高频交易策略为投资者带来收益。更多的,在零售金融领域,AI可以用作智能客服,提供24小时在线咨询服务。通过自然语言处理和语音识别技术,AI能够理解客户的需求,提供准确的答案和解决方案。另一应用场景可拓展到营销业务,AI能够协助金融机构分析客户行为,为其提供定制化的营销策略。例如,通过分析客户的消费习惯和兴趣爱好,金融机构可以向客户推荐符合其需求的金融产品。 • 零售金融中的人工智能 • 零售金融作为银行的重要业务,与AI的结合将更有利于优化用户体验及提高效率。主要应用领域可覆盖信用评分与风险管理,欺诈检测与预防,个性化推荐与产品营销,智能客服与聊天机器人,聊天机器人营销,语音识别与虚拟助手,自动化与智能化运营,大数据分析等。摸象科技2007年成立的摸象科技,在大数据领域持续耕耘,最初采用谷歌开源Bert模型,结合深度学习+领域知识库平台,进一步压缩模型结构、增加并发数,构建了金融行业垂直模型。目前,摸象与高校联合自主研发的垂直金融的语言大模型,模型规模已达7B,可进一步扩展。训练的数据集垂直于零售金融方向,涵盖了金融知识图谱、金融文本、金融对话等多种数据源。摸象科技已为国内数十家省分行及股份行提供AI+金融数字员工解决方案,AI员工“象小秘”垂直于150个业务类目的场景,并被应用于银行营销和运营场景中。区别于传统RPA为后端提供自动化解决日常重复性任务的数字员工,摸象科技重点在于赋能员工实现人机协同,提升工作效率。 *RPA机器人:Robotic process automation,又称“RPA机器人流程自动化”“机器人过程自动化(RPA)”“软件机器人”,使用智能自动化技术来执行人类工人的重复性办公室任务。 △摸象科技AI员工赋能,企业供图 • 内容科技中的人工智能 • 有连云有连云国内领先的金融AIGC服务提供商,针对金融市场的时效性,致力于帮客户解决以sales and marketing为主导的应用场景问题,并把商业模式立足于解决开源层面的痛点。其中,有连云服务的客户群体主要包括金融机构与上市公司。金融领域的痛点与一般场景不一样,对准确度要求较高,有连云AI模型可以有效降低人为错误。△有连云场景及技术,企业供图深擎科技成立于2018年的深擎作为内容科技与智能营销服务商,运用人工智能、大数据及财经资讯运营能力赋能金融机构,提供从内容生产、加工、分发到触达运营全流程的解决方案。基于对金融业务场景的理解,持续性地为金融机构提供内容科技服务,通过个性化推荐、智能标签以及智能内容运营等产品和服务,帮助金融企业激活存量客户,提升用户体验,促进交易转化。公司创始人、CEO柴志伟介绍,针对券商及银行在吸纳新客户过程中面临的高昂成本和收益不稳定的问题,深擎的主要关注点在于提升用户活跃度和交易频次,从而保持用户粘性,而非单纯依赖于购买流量来实现用户增长。其中在财经内容生成和管理方面,深擎科技会把来自财经官媒、自媒体等渠道的资讯、视频进行聚合,再经AI和人工审核,每天20万篇新增内容进行AI审核(涉政涉敏,涉黄涉暴等),还包括金融行业的数据错误(如媒体记者在利润率、增长率等财务参数上的笔误)。柴志伟表示,金融行业受严格监管,对内容发布的要求非常高,并不是简单撤回就可以。具体案例可体现在某银行客群,通过深擎的内容赋能,在内容端UB提升95%,UV提升63%。*UB(User Behavior)是指用户的行为改进,包括用户在平台上的互动、使用频率、停留时间等方面的改善;UV(User Visits)是指用户的访问量,表示访问平台或内容的用户数量。△深擎科技解决方案矩阵,企业供图飞笛科技作为财经AIGC生成和分发平台,依赖基于全网财经信息的大数据引擎,飞笛将内容数字化+AIGC和AI投顾技术深度运用于赋能机构线上财富管理和买方服务中,强调以“买方”的视角设计数字化产品和服务,以帮助金融机构实现传统零售和经纪业务、财富管理业务的数字化转型,帮助用户获得更好的买方服务并实现可持续回报。对于金融行业在内容科技方面的痛点,飞笛科技丘慧慧表示,2016年后,金融机构曾经有一轮要做“垂直今日头条”的建设高潮,但金融机构本身没有那么多的数据,也没有足够量级的用户和足够量级的免费内容,很难依靠算法做到千人千面。其次,相比互联网平台容错率比较高的兴趣推荐,金融更偏向于是“价值推荐”,容错率低,彼时,基于专家系统的AIGC可以很好地解决该些难题,但并没有被充分运用起来,金融行业的那时候走的弯路现在仍在继续。现在新的一轮基于大模型的AI浪潮又来了,但是显然,上一轮没解决好的按“价值”逻辑进行生成和推荐的问题,大模型时代仍要率先面对并解决。飞笛将自身的竞争壁垒归纳为:基于全网海量信息大数据的实时“算力”,赋能金融机构内部场景下的数据治理、服务与内容生成、业务场景和用户个性化分发,以提升金融机构“运力”,提升机构运营的ROI和用户满意度。她特别强调,金融场景下,首先要解决AIGV,实时价值发现问题,其次才是AIGC,因为用户信息过载+金融信息高频的特点,通过外部信息数据能力的导入,为机构内部提升运营效率非常重要。数字化的运营决策力、内容生产力、按业务场景和用户的个性化分发力,都使得机构的整个运营过程变得更加敏锐且灵活。△飞笛科技数据-内容-智能交互流程,企业供图 • 投研中的人工智能 • 熵简科技主要服务于基金/资管、证券公司等机构的熵简科技,依托大数据、云计算、AI等技术,为资管机构提供智能投研辅助决策的工具,并实现投研数字化。熵简科技费斌杰以石油行业研究为例,对特定领域进行了深入分析。在分析石油行业时,中高级分析师会审视一系列高频指标,供需因素、页岩油信用债扩张周期、政治因素、沙特和欧佩克的减产计划等,都是石油行业的关键分析框架。在此基础上,仅仅简单地询问GPT可能无法获取详尽的信息,这对于投资决策是远远不够的。投资决策需要基于市场信息作出买入卖出决策,这也是为什么要在细分领域寻求专业化的原因。熵简科技又以海上风电为例,在研究该行业,补贴退坡、并网情况等都是重要指标,而再往前又可再追溯到一系列前瞻性指标(装机情况、吊装情况、招投标、核准等)。在投研过程中,每一个环节都包含许多关键的高频指标,如何将这些数据和逻辑串联起来并形成一个能够投资的AI,是未来AI厂商可拓展和思考的方向,而这一领域的价值毋庸置疑。文构财经文构财经基于多年积累的数据的先发壁垒,其数据范围覆盖中国沪深、中国香港、美国、新加坡、英国等证券交易所,近20年的海量财经数据,清洗出共计近500G的中英文财经语料(目前数据状态为均已清洗、标定、学习后)。通过AI理解能力与应用场景的深度结合,文构财经为用户提供了基于财经文本的全新深度处理后的数据、指标、分析师报告,从而为学术研究、量化投资、经济监管等提供多方位支持。△文构财经数据库,企业供图 AI+金融:挑战与展望 • 关于挑战 • 未来,随着AI技术在金融领域的更深入发展,更加迫切地需要人才端与业务端的深度结合,以应对日益增长的合规要求。这种深度结合不仅涉及了专业技术的应用,还涉及了跨学科的整合,以及对市场的敏锐洞察。飞笛科技的丘慧慧表示,在未来的金融领域,人工智能预计将迎来更加广阔的发展空间。然而,这种发展也面临着一定的挑战。其中一个关键的挑战是金融机构自身的组织结构。金融机构能否以用户为中心进行组织架构的调整,是决定企业能否成功进行结构转型的关键因素,而跨界人才的挑战是企业所面临的重要挑战。有连云认为,金融领域,对于不同业务场景的理解需要长期积累经验。金融业务有复杂性和专业度,不是简单能驾驭。有连云系统能够实现高效的AIGC生成,这是通用大模型难以完成的任务,而打造具有较高黏性的产品,需要有足够的业务Know-how,并懂得如何进一步优化客户的使用体验。深擎科技表示,AI在金融领域的挑战主要在于B2B领域的商业化实施过程,金融行业分支机构和总部的数字化协作难以有效打通这个矛盾。作为一家创业公司,面临着与客户个性化、定制化需求及标准化产品之间的冲突。深擎科技柴志伟认为,还是要在产品理解上超越客户,充分把握客户的需求和特性,以便为客户打造价值产品。此外,公司还需要积累大量的行业案例和实践经验,以更好地指导和支持客户需求和发展。轻咨询是一种值得采用的服务模式,它可以通过团队在早期与客户的沟通和交流,影响客户的规划和预期,帮助客户将想法收敛到一个可以标准化实施的解决方案,从而实现客户需求的合理满足,以及双方共赢的局面。在人才与技术挑战方面,熵简科技费斌杰认为,AI科技的发展,其核心仍是技术层面的探讨。技术问题并非一蹴而就,它需要深厚的专业积累。倘若把AI视作一个黑盒,训练的关键在于持续优化这个建模过程,如果技术人员未曾尝试过此类操作,那么相关的经验积累无疑将是一片空白,即使能了解大致的操作流程,但要想深入理解这类技术性的经验,仅仅通过理论学习是不够的。这也是在第一线亲自操作和实践的重要性。例如,技术人员至少需要亲自调优过GPT模型。然而在全球范围内,这样经验丰富的专业人士实际上是稀缺的,不仅仅在国内,在海外也同样如此。 • 关于模型的迭代 • 从一个中立的角度对金融领域中各类模型进行比较,就现有技术而言,如GPT、BloombergGPT、FinBert等,各模型间存在着一定的差异。在实际金融领域的应用中,随着参数量及数据集、数据类型及权重、所应用的垂直任务不同,模型的效果也不同(Nan, etc., 2023;...