文章主题:金融行业, 大模型, 金融机构, 金融科技
本报记者 李晖 北京报道
金融领域作为一个数据资源丰富且实践场景多样的行业,具备与大型人工智能模型深度结合的巨大潜力。作为数字技术最紧密的试验场,金融机构对于大型人工智能模型的关注程度很高,但在实际投入方面却持谨慎态度。
在金融领域,一位专家表示,评判大模型的价值主要在于其是否能解决原本业务中存在的效率和准确性难题。而腾讯云计算(北京)有限责任公司的总裁邱跃鹏则持有不同观点,他认为大模型并非越大越好,金融机构应在实际应用场景中精简模型,以达到最高的效率和最低的成本。
《中国经营报》的记者最近发现,许多科技公司开始关注金融业务最后的环节。在11月23日,腾讯云正式推出了金融行业的大模型解决方案。在同一天,北京中关村科金技术有限公司(简称“中关村科金”)也发布了企业知识大模型、开发平台,以及AIGC应用等多个产品。此外,早在之前,蚂蚁科技集团股份有限公司(简称“蚂蚁集团”)就宣布了其百灵大模型已经完成备案,并且基于此大模型的多款产品也已完成内测,预计将很快对公众开放。
对大模型的“理解误区”
在2023年8月,波士顿咨询(BCG)发布了一份名为《银行业生成式AI应用报告(2023)》的研究报告。该报告指出,银行业在运用生成式AI时,主要遵循两种价值创造路径。第一种路径是替代人工,也就是通过接受大量重复性和简单的基础任务,从而释放出运营类人力资源。第二种路径是赋能人工,这主要是通过利用生成式AI的“对话”和“创造”能力,将AI作为助手,放大关键节点的“人”的产能,进一步赋能专业内容和基础管理环节的形成。值得注意的是,生成式AI的应用场景可以覆盖银行全产业链的各个环节,包括但不限于营销、获客、投研、风控等领域。
《报告》指出,未来生成式AI在银行业的发展进程,将受到两个主要因素的影响。首先,随着中文通用大语言模型的不断进步,其在未来银行业中的应用将更加广泛。其次,通用大模型针对银行业的特定需求和场景进行适配与优化,将对银行业的数字化转型产生重要影响。这两个方面相辅相成,共同推动生成式AI在银行业的广泛应用。
自今年年初至今,我国大模型市场已经完成了从基础大模型、行业大模型到应用大模型的三次跃升。据腾讯研究院在今年7月底的一项调研结果显示,我国拥有超过10亿参数的大模型数量已经高达116个,其中金融行业的大模型数量约为18个。这充分展示了我国在大模型领域的强大实力和广阔前景。
中国信息通信研究院云计算与大数据研究所人工智能部主任曹峰指出,在过去的一年中,大模型的发展速度极快,其焦点从最初的基础能力转向了大模型的开发平台,最终形成了基于大模型应用生态的构建。然而,当前行业内最需要解决的问题是如何将大模型真正落地并投入运营,以及在产业环境中发挥更大的作用。
对于金融机构来说,要在产业环境中发挥作用,显然需要将业务推向“最后一公里”。然而,实际上,由于算力、数据和技术等方面的门槛较高,许多中小金融机构仍然面临着无法逾越的难题,只能望尘莫及。
一家中部省份城商行人士向记者表示,银行对大模型很关注,但感觉和小机构实际需求比较远,成本也太高,行内态度主要是先看头部大行怎么实践,再选择如何跟随。
在邱跃鹏看来,目前行业的一个误区在于:当大家想到大模型时都想去追求大参数、大size,觉得越大越好。但他的团队在实践中发现,很多场景中动辄一两千万元的成本不是每家企业都能承受的,必须考虑ROI(投资回报率)。
以金融业务中重要的智能识别技术(OCR)为例,金融行业的票据、单据处理需要大量非结构化的信息进行专业的处理,传统OCR深度学习模型需要有大量的定制,要做票据的检测、识别、程序化,错误率非常高。
邱跃鹏透露,OCR的一站式学习平台和大模型可以解决上述问题,但在参数选择和精调程度上要求很高。“如果把识别出来的文字灌到大模型中去做更好的图像理解、文字内容理解,不一定是最高效的解决办法。当我们在实践中把参数适当降下来后发现它对算力要求降低了却能很好解决场景问题。”他表示。
记者调研采访了解到,当前金融机构部署大模型主要有三种方式,除了极少机构有能力进行独立自研,更多采用的是与第三方合作形式,其中包括与通用或行业大模型合作再进行微调,也包括从云端调用接入大模型API(应用程序编程接口),完成私有化部署。而科技背景的平台型公司作为输出技术的主力军,通常在母公司的通用大模型基础上开发新的行业大模型,金融机构在实践中通常可以根据不同细分场景的业务需求,灵活选择各类大模型,降低大模型使用成本。目前,基于百度的文心一言、阿里的通义千问、腾讯的混元大模型,都有面向金融行业构建生态合作伙伴的部署。
以腾讯云为例,其推出的金融行业大模型解决方案包含四层架构——算力层、平台层、大模型层以及应用层。在大模型层,通过模型商店MaaS,支持接入腾讯混元大模型、金融行业大模型及20多个主流开源模型。在应用层,基于金融行业大模型的能力,结合金融行业前中后台业务场景,打造一系列智能应用。
腾讯云副总裁、腾讯云智能解决方案负责人王麒在接受媒体采访时表示,不同的金融企业可以根据自身的投入成本以及场景复杂度,选择在不同的点切入自己的金融行业大模型,在能效比方面寻求一个最优的选择。
他还透露,在上述OCR技术使用场景中,通过领域精调和训练,实现了参数和场景适配的较好效果——将交易的票据提升到了95%,同时降低了人力的成本,单张单据的处理时间从以前的五分钟降到了五秒。
一位国有大型银行研发中心负责人在近期谈及大模型发展原则时也表示,数据是核心,但数据不是越多越好,高质量训练数据才是关键;算力是基础,算力瓶颈是挑战也是机会,开源节流才是关键;场景是关键,但场景建设也需要合理布局。
机构路径选择分化
大型企业倾向从上到下提供一揽子解决方案,行业中小机构则倾向通过生态合作来实现自己的大模型解决方案输出。
具有清华技术背景的北京智谱华章科技有限公司(以下简称“智谱AI”),过去一年推出了多种量级的ChatGLM大模型,以适配不同市场需求。在智谱AI总裁王绍兰看来,大模型不是天生就可以拿来赋能行业,需要大量的行业生态合作伙伴一起做工程开发。
以中关村科金为例,其选择通过与优秀的底层通用大模型企业合作,通过领域知识库注入领域知识,在开源的通用大模型基础上微调出适合金融等行业的领域大模型。在具体的业务产品构建上,通过企业知识大模型,支撑平台领域大模型工厂、领域知识库工厂完成“行业化”过程,继而输出智能营销、智能服务、智能运营、超级员工四类产品。
中关村科金技术副总裁张杰向记者透露,大模型价值的根本在于多样化业务场景的实际应用,且成本可负担、安全性可控、业务深耦合。他倾向认为,企业应用大模型不一定用千亿级别规模参数非常大的模型,关键是依据每个企业的高频需求让企业可以用上,并且成本可负担。
财富管理被普遍认为是生成式AI有望最先得到广泛应用的场景。在国际市场上,摩根士丹利已经开始采用GPT 4.0来优化财富管理咨询流程,帮助约1.6万名财富管理顾问。
诺亚控股有限公司数据管理部总经理孙甜指出,高净值客户开户涉及资料整理和流程审批复杂,需要高水平的24小时客服支持,通过中关村科金ChatPilot知识助手赋能智能客服,客服系统问答意图识别和回复的准确率大幅提升,文本客服运营工作量减少70%以上,回答效果可以提升50%以上。
融360(北京融世纪信息技术有限公司)则基于腾讯云的底座,开发出全链或者一站式的解决方案。融360创始人、CEO叶大清认为,大模型在实际应用中不能为了做而做,需要考虑业务简单方便和底层大模型的兼容能力。
在王麒看来,做底层通用大模型是一个“深水区”,需要多年的技术积累。最终,行业应该是少数几家头部厂商能做底层大模型,更多合作伙伴加入进来做精调,即做好“最后一公里”,来实现应用落地。
腾讯云副总裁胡利明在接受采访时则建议,行业的机构以及合作伙伴可根据自身需求甄选场景和试点——从场景价值、需求频次、技术三个维度进行整体的选择,如营销、客服、风控等需求频次多、价值大、技术成熟度高的场景可先进行试点,而舆情监控、智能投顾、投研以及代码助手则可作为第二优先级。
至于此前被认为大语言模型较难被突破的风控环节,胡利明也透露,腾讯云基于行业大模型以及金融风控的经验,通过大量的预训练和知识蒸馏形成Level 2的风控模型。“我们和某头部股份制银行合作的信用卡风控场景,在它的活动周期内贷款环节查询量有500万次,最终查到5万次的诈骗行为,帮助客户避免了超过亿元的损失。”
金融行业, 大模型, 金融机构, 金融科技
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!