《一剑封侯》
AI金融助手

《一剑封侯》

很抱歉,您没有提供文章内容。请您提供完整的文章内容,我将尽力为您做出专业的摘要总结。
原创|  如何释放大模型对金融行业的价值?
AI金融助手

原创| 如何释放大模型对金融行业的价值?

“综合考虑投入和产出性价比,中小金融机构可按需引入各类大模型的公有云API或私有化部署服务,直接满足赋能诉求。”——吕仲涛 新金融联盟学术理事、工商银行首席技术官“类GPT模型是高级复读机,有多少‘人工’就有多少‘智能’。模型100%会犯错,模型之上必须要有运营兜底机制,知错就改。”——胡时伟 第四范式联合创始人、首席架构师“AI很容易被媒体炒作,还很容易找到好的case,一开始我们会惊讶于好case,但慢慢发现它不一定能够普世。”——沈志勇 民生银行数据管理部总经理 上述观点源自6月10日新金融联盟举办的“金融机构数智化转型与大模型技术应用”内部研讨会。会上,吕仲涛、沈志勇、平安银行数字资产管理与研发中心总经理刘锦淼、胡时伟做了主题发言。新金融联盟理事长、中国银行原行长李礼辉、中国信通院金融科技研究中心副主任赵小飞进行了点评交流。 56家银行及非银机构、55家科技公司的170多位嘉宾通过线上线下参会。会议由新金融联盟秘书长吴雨珊主持,中国金融四十人论坛提供学术支持。以下为部分精彩内容。 研讨会现场大模型=大算力+大数据+强算法 今年以来ChatGPT风头强劲,带火了大模型技术。大模型即网络参数规模达到亿级以上的“预训练深度学习算法”,在文本图像理解、内容生成等任务表现出显著优势和巨大潜力。 “大模型必须基于‘大算力+大数据+大算法参数网络结构’进行训练。”吕仲涛介绍,大模型技术是一个复杂的体系性工程,涵盖大模型算力集群建设、算法沉淀、配套流水线工具、大模型服务等内容。 赵小飞认为,硬科技对于大模型的发展也很重要。2012年,英伟达将其GPU应用于深度学习研究,GPU的并行计算能力在处理密集数据时效率远高于CPU,为英伟达成为AIGC最大的获利者埋下伏笔。OpenAI在GPU算力升级的加持下,从GPT-1迭代到GPT-4。 “能够支持AI大模型的算力基础设施建设需要持续投入巨大的财力、人力,要花得起钱,找得对人,还要耐得住寂寞,这就势必导致算力集中。一是向主要国家集中,二是向资本巨头和科技巨头集中。”李礼辉表示。 李礼辉指出,算力基础设施的布局和建设应该锚定全球领先的目标,硬件与软件并重并行,国家级与企业级联动联调,新中心与老中心集约集成,人力资源与运营成本统筹兼顾。 “从参数规模来看,百亿大模型具备一定的文本生成和通用能力,但难以处理逻辑复杂、专业性强的任务;万亿大模型因算力消耗极大,短期内难以进行商业推广应用。”吕仲涛表示,千亿大模型平衡了百亿和万亿大模型优势,性价比优势明显,是近几年发展及应用的重点。 ChatGPT是目前最先进的AIGC大模型应用。“要打造与ChatGPT媲美的AI大模型,就一定需要无断层、无障碍的数据供给。但是,数据共享模式的局限可能影响数据价值的深度开发,地缘政治冲突可能影响全球数据资源供给格局。”李礼辉认为,要参与数据跨境流动,在维护数据主权的同时,充分利用全球数据资源,打造算力竞争优势。有多少人工就有多少智能 尽管大模型十分强大,但也裹挟着一些风险。 “受制于当前模型黑盒、计算复杂度高等因素,大模型存在答非所问、科技伦理风险等方面问题。比如,ChatGPT生成大量看起来合乎逻辑,但内容可能并非真实甚至是捏造的事实,存在非法利用、造谣等安全隐患。”吕仲涛表示。 李礼辉强调,对AI虚假与AI操纵必须高度警惕,重点是提升深度合成内容鉴别技术;建立AI信任制度,加强AI监管,在国家层级建立预防AI操纵的防火墙。 如何理性看待大模型,胡时伟分享了三点认知: 第一,要相信科学,没有大模型涌现的逻辑。类GPT模型的背后还是机器学习,要想有一个好的模型能力,必须基于基础大模型的调优以及行业特定操作。 第二,类GPT模型是高级复读机,有多少“人工”就有多少“智能”。通用大模型都是用人类现有语料训练,其正确性一定来自于人反馈的数据,行业一定要不断迭代告诉大模型什么是好的、什么是对的,这必须靠人工完成。 第三,模型之上必须要有运营兜底机制,知错就改。模型100%会犯错,哪怕是GPT4,在行业专业、严肃场景的应用不可能达到工业可用的效果,人工兜底机制让它从不可用变成可用。 “知错就改有三个机制叠加保障:一是专家给答案;二是专家给示例;三是专家生成的知识反馈给模型,让模型少犯错。”胡时伟表示。大模型对金融行业价值几何 要将大模型融入具体行业的核心生产经营流程,可谓任重道远。 赵小飞以工业为例分析,工业场景中的很多数据是不可读取的,或者即使读取了也需要一个翻译和解读的过程。在数据之外,工业领域对安全、稳定、可靠等指标极其严苛的追求,才是生成式AI不能满足的地方。此外,工业制造细分领域众多,没有海量数据标签,基本上不可能形成类似GPT的通用大模型。 “金融行业生产经营虽然没有工业那么复杂,但对于民生、经济安全的影响会更高,所以对于新技术应用需要非常谨慎。”他表示。 吕仲涛表示,由于大模型技术尚不成熟,存在伦理风险。短期内不建议直接对客使用,应优先面向金融文本和金融图像分析理解创作的智力密集型场景,以助手形式,人机协同提升业务人员工作质效。不过,虽然大模型有各类安全风险,但同样给银行业数智化转型带来新机遇,其潜力和空间是无限的。 “未来大模型银行业务的应用场景非常丰富。”刘锦淼介绍,从BankGPT反馈的测试情况来看,它已经具备作为一个智能助手适配场景相关落地的能力。目前已经应用的场景有客户服务、信贷审批、投研服务三大类。 他还表示,在AI应用和业务投产方面,AI算法模型对业务发展的价值如何、能多大程度覆盖全行业务场景,让算法替代人还是让算法永远服务人,投产策略能否做到线上化、自动化、投入产出量化根因回溯分析……都是未来可以思考和探索的方向。 一个超级模型VS.一堆专业模型 “短期内,大模型和传统模型会共存,同时,大模型可作为中控,将传统模型作为技能进行调用。长期看,若大模型计算复杂度降低、可解释性增强,综合性价比来考虑,大模型将逐步替代传统模型。”吕仲涛分析称。 沈志勇认为,大模型的应用好比炼钢。作为通用底座的炼钢工厂越大越好,要集中力量办大事,避免遍地小高炉。而作为应用场景的用钢,则应多元化、市场化。“用钢”部分可以分成两段,AIGC或者其它一些大模型的应用场景端形成市场化,具体应用场景里自己负责。 吕仲涛表示,需要探索形成一套面向银行业的高标准、低门槛的银行业金融大模型应用模式,才能快速推进人工智能在行业的深化应用。 预算是有限的,预算决定了算力,算力决定了参数规模。“我们需要抉择——要一个超级大模型还是一堆专业模型?”胡时伟说。 “一个思路叫大力出奇迹,如果做一个超级大模型,以中国目前的算力情况,要五年后才能实现,但数字化进程不能等,五年之内如果纯粹以大为方向,就是主动把脖子送给别人卡。”胡时伟认为,我们会走另一个方向,用“学件”的思路,做一堆专业模型,各司其职,方便迭代,便于维护,成本可控。就好比一个公司,不能全部都是董事长秘书,还需要销售、产研、行政等。超级英雄成本很高,也很难管理。 (文| 余春敏) 往期研讨会回顾 互金协会、金融机构、催收公司共议:催收的边界在哪,如何应对反催收黑产? 银行理财距离真正的投研驱动有多远? 银行理财规模持续下滑,如何止血? 个人养老金业务发令枪响,银行、理财子如何接招? 【关于我们】 新金融联盟(NFA)成立于2016年,致力于打造一个高质量的新金融政策研讨和行业交流平台。成立以来,联盟共组织各类闭门研讨会、优秀企业参访近百场,议题涵盖数字金融、数据治理、资产管理等方向。部分研讨成果形成报告,呈送给相关部门,推动了业界与监管的沟通交流,助力理事单位的合作共赢。
《探索未知:人工智能助你领略科技之美》
AI金融助手

《探索未知:人工智能助你领略科技之美》

这篇文章探讨了如何通过微信公众号公众账号来吸引更多的用户。首先,文章介绍了微信公众号的优点和特点,包括其丰富的内容和广泛的影响力。其次,文章提供了一些建议和策略,帮助用户更好地利用微信公众号来宣传自己和自己的品牌。最后,文章呼吁用户关注微信公众号,并鼓励他们在平台上分享自己的经验和知识。
ChatGPT将给金融行业带来哪些新的可能?
AI金融助手

ChatGPT将给金融行业带来哪些新的可能?

2022年底,OpenAI公司推出聊天机器人ChatGPT,一时间引起全网轰动。上线仅5天,就吸引了全球100万以上的新用户。与普通的聊天机器人相比,ChatGPT更能听得懂“人话”,不仅可以理解复杂语句内容及上下文语境,快速给予用户一个清晰的、高质量的解答,并且连写小说、改代码、进行考试答题等复杂任务也不在话下。难怪连马斯克也感叹“ChatGPT is scary good. We are not far from dangerously strong AI” 。 毫无疑问,ChatGPT的出现将是对传统互联网搜索引擎以及交互方式的一个颠覆,同时也将给传统行业一直走在创新技术应用前沿的金融行业带来更多赋能和新的可能。 一、ChatGPT的厉害之处 ChatGPT中,Chat指聊天对话,GPT全称为Generative Pre-Trained Transformer,其中Transfomer是一个技术专有名词,其也正是ChatGPT的技术基础。具体来说,Transfomer是一个由谷歌提出的全新深度学习模型,其摆脱了以循环神经网络模型需要人工标注数据集及必须进行顺序计算的限制,能够实现非常有效的并行学习,训练出真正的大模型。而ChatGPT则是Transfomer的集大成者,呈现出如下几个重要特征: 一是可通过数十亿海量网络数据(例如网页、新闻、社交媒体等)进行预训练,学习语言模型的基础知识。二是可在预训练过程中同时学习语言模型、问答系统、机器翻译等多种自然语言处理任务。三是具备理解上下文关系及语义推理的能力,并生成响应的回答。四是其在线学习机制能够不断学习新的知识,并更新模型参数,从而适应不断变化的语言环境和应用场景。五是可在已经训练好的模型上进行微调,并使用新的数据来更新模型参数。 基于以上特征,ChatGPT在使用体验上也远超传统的智能聊天机器人,主要表现在:更加生动自然、强大的对话能力。ChatGPT能生成更加自然、更像人类口语化的对话内容,甚至可以质疑不正确的前提和假设、主动承认错误或拒绝不合理的问题。持续、深入对话的交互能力。ChatGPT拥有复杂语句理解和连续语境沟通能力,可以在同一个话题及持续交互的场景中下做持续多轮的交流。对输入内容包容度高,输出内容质量好。ChatGPT只有一个输入框,可允许用户输入任何问题或任务,并在绝大部分领域给出专业的回答。 二、ChatGPT在金融行业的应用空间及场景 一方面,金融行业是一个体系复杂而快速发展的行业,需要处理大量的数据和信息,工作效率的提升是其重要的需求之一;另一方面,金融业作为覆盖范围最广的服务行业之一,服务客户、以客户为中心永远都是业务发展的立足之本。而ChatGPT则可以较好地从这两方面为金融行业提供新的可能。 首先,ChatGPT在金融行业的应用可以大大提高工作效率,并带来业务变革。其中一个显著的变革是自动化。ChatGPT可以帮助金融机构从海量数据中快速提取有价值的关键信息,例如行业趋势、财务数据、舆情走向等,并将其转化为可读的自然语言文本,如行业研究报告、风险分析报告等,大大节省人力成本。同时,GPT可以帮助金融机构生成自然语言的智能合约,从而简化合约流程,提高工作效率。另外,ChatGPT可以快速分析财务数据及风险数据,并生成自然语言的财务分析报告或风险评估报告,帮助公司机构快速识别机会和风险,并做出决策。 其次,ChatGPT可以帮助金融机构提供更加人性化的智能客服。一方面,ChatGPT可以自动生成自然语言的回复,满足To C客户的个性化咨询需求。通过语义分析识别客户情绪,以更好地了解客户需求和提供更好的服务,从大大提升智能客服的准确率和满意度,增强品牌形象。另一方面,ChatGPT可协助金融机构形成企业级To B端的智能客户服务能力。一般来说,B端用户专业门槛高、业务场景复杂,智能客服知识中心搭建成本高、效率低,ChatGPT的应用则将有望利用深度学习技术提升B端用户的服务效率和专业度。 最后,金融机构可以利用其在金融领域的海量知识储备,运用在金融消费者教育领域。金融产品更新迭代迅速、金融知识有认知门槛、金融诈骗手段层出不穷……金融消费者的教育一直是监管部门和金融机构的重要工作之一。ChatGPT通过模型和基础专业知识的训练,可为金融用户提供生动、有趣、及时且准确率高的金融科普知识,提升普通消费者的金融素养。 与ChatGPT的对话截图 当然,ChatGPT在金融行业的应用也必然会存在一定挑战。例如ChatGPT生成的文本质量可能不如人类写出的文本;ChatGPT对数据要求较高,如果输入的数据质量不高,其生成的文本也可能不准确;落地部署成本及投入产出比在前阶段尚无法很好测算;此外,ChatGPT的应用也需要遵守相关的法律法规,如隐私保护法等。但总的来说,ChatGPT在金融行业的应用前景广阔,能够带来诸多变革和改变。金融公司应该积极探索GPT的应用,并利用其优势,为客户提供更加优质的服务。 作   者 彭丹萍  中国信息通信研究院云计算与大数据研究所金融科技部,高级项目经理,主要研究方向包括金融科技前沿技术应用、金融信创、数字普惠金融等,pengdanping@caict.ac.cn ——— 往 期 推 荐 ——— ▶  原创文章 | 老有所养,金融科技如何在个人养老金中发挥作用? ▶  原创文章 | 漫谈操作系统兴衰 ▶  中国信通院发布《中国金融科技生态白皮书(2022年)》 ▶  原创文章 |...
交行副行长、CIO钱斌谈生成式AI金融应用前景,已设立相关实验室
AI金融助手

交行副行长、CIO钱斌谈生成式AI金融应用前景,已设立相关实验室

《银行科技研究社》消息:7月8日,2023世界人工智能大会“新一代AI·新时代金融”论坛在上海世博中心举办。交行党委委员、副行长、首席信息官钱斌出席并发表演讲。 钱斌强调,去年ChatGPT横空出世,可能一个新的时代即将到来,人工智能极有可能从传统意义上的体力劳动替代向脑力劳动替代转变,它所带来的改变和冲击将是爆炸性和颠覆性的,甚至会改变人类的未来。 ChatGPT等生成式AI将带来颠覆性变革 追溯历史,运用和发展通用人工智能由来已久。上世纪五十年代就出现了图灵测试,最近十年取得一些突破,比如AlphaGo。然而,这些产品距离真正的通用人工智能相差甚远,基本停留在大算力和专用能力。但ChatGPT的出现,让我们所有人真切地感受到新赛道的颠覆性威力。 首先,算力、算法、数据的相互赋能,使人工智能出现了涌现效应。ChatGPT的成功离不开成熟的模型底座、丰富的数据供给和强大的算力支撑。算法方面,在循环神经网络、Transformer等算法思想、架构上逐步传承、积累。从公开数据来看,GPT模型参数从2018年最初的1.17亿,到GPT3已达到1750亿。数据方面,海量增长的数据为模型训练和应用提供了丰沃土壤。根据IDC数据统计,2022年全球数据总量为103ZB,中国占比接近1/4,预估2027年全球数据总量将达到284ZB。算力方面,模型训练参数与算力成正比,据OpenAI测算,自2012年以来,全球头部AI模型训练算力每3-4个月翻一番。 在算法、算力、数据的共同加持下,目前GPT已支持文本和图像输入,在多种专业和学术考试中已经表现出与人类相当的能力。 其次,生成式AI改变了人类知识的存储、传承和使用方式。过去五千年,人类知识被储存在文字中。互联网的诞生,改变了人类记录知识、获取知识的方式,加速了人类应用知识、创造知识的速度。而当下,因为生成式AI的突破式进展,人类的知识体系将被构建到大模型中,这是人类知识存储、传承和使用方式的再一次重构。 人工智能从固定任务场景触发,逐步进化为通过自然语言接受指令、理解人类意图并不断迭代,由简单的“人力替代”向“人机协同”转变,实现人工智能从交互中学习,与人共同完成知识创造。 第三,人工智能正在由专用能力向通用能力转变。以往人工智能基本都是专业领域、边界清晰、定义明确的单一任务模型,任务稍有变化,效果会大打折扣。而以ChatGPT为代表的生成式AI,具有了涌现能力、思维链推理能力、多模态理解和生成能力,实现了从文本理解到图像理解,从对话理解到全文理解,从意图理解到创意实现的根本性改变,不仅能够完成文学创作、代码生成、图片生成等多项任务,伴随数据和参数的规模提升,生成式AI拥有了学习和成长的基因,表现出的学习能力、理解能力已接近人类表现。 生成式AI作为走向通用人工智能的关键技术路线,正掀起产业变革浪潮。据彭博预测,未来十年,生成式AI市场规模将从2022年的400亿美元,增长至2032年的1.3万亿美元,年复合增速有望达到42%。 金融领域也将受到新技术应用的影响。 生成式AI将提升金融业客户服务、运营、风控等效能 金融业具备大规模、高质量的数据资源和多维度、多元化的应用场景,是人工智能应用落地较为深入的领域之一。近些年,智能客服、智慧营销、智能风控等领域,相关技术应用取得了不错成绩。 但是,生成式AI是人工智能领域的一次范式转变,开辟了新的赛道。钱斌指出,新技术将有助于解决包括金融发展不平衡、不充分的结构性问题,数据要素向数据资产转化、金融科技人才短缺的问题,并带来客户体验、运营效率和风险防控等经营效能提升。 一是探索升级客户服务能力。生成式AI将变革人机交互方式,赋能差异化的产品和服务创新,促进实现从人性化、个性化到感性化的体验升级。比如,在精准营销方面,借助生成式大模型,在灌注专业领域知识后,可以提升行业洞察能力,并更为精准地解读个体个性化需求,帮助实现从理解“客群”到理解“客户”的跨越;在智能客服方面,生成式人工智能在准确理解人类意图,进行流畅、自然、高质量的对话上具有优势,甚至能够体现出一定的共情能力,结合文档理解分析和生成能力,人机交互的体验和效率将有望出现质的飞跃。 二是探索提升内部运营效率。探索将生成式AI应用于运营流程优化、运营模式创新、运营知识提供,从而实现运营效率提升、运营成本降低。比如,在软件研发方面,Gartner预测,到2027年,将有15%的新应用程序由AI自动生成,金融业可利用大模型实现代码生成、代码审查等能力,提升研发效率和质量;在智慧办公方面,可以存储复杂、专业、动态的制度规范,以在线问答的形式为员工提供高效精准的工作指引,成为提升员工能力的“智慧助手”。 三是探索精准的金融风险防控。生成式AI或将帮助金融机构更快识别、分析和预测风险。比如,在反洗钱、反欺诈方面,可探索借助大模型的泛化能力提升知识图谱构建效率,从而提高欺诈行为和洗钱活动的识别效果,及时发出预警,在减少客户损失的同时,降低银行自身法律合规风险。 机遇伴随着挑战,生成式AI所形成的诸多挑战,需要加以关注和重点研究解决,包括大模型对算力、算法、数据的协同的高要求和对基础设施建设的冲击,数据少、质量差和处理能力弱降低了人工智能大模型的“智商”,以及技术、应用、场景等生态体系间的竞争问题。 钱斌也介绍,交行今年上半年已成立人工智能联合创新实验室,制定GPT大模型建设规划,组建专项团队,加快生成式AI在金融场景的应用。 银行业金融科技社群,有兴趣的朋友请添加群主:yktworld 备注:公司+姓名+职务+银行入群。仅限银行科技工作人员。
探索中国传统文化的魅力:一生的文化之旅
AI金融助手

探索中国传统文化的魅力:一生的文化之旅

这篇文章主要介绍了如何成为一名优秀的文章写作高手。首先,要明确自己的角色和目标,即以写作为职业并追求卓越。其次,要不断学习和实践写作技巧,包括研究和分析优秀文章、多写多练和反思总结。最后,要保持对写作的热爱和专注,充分发挥自己的才华和创造力,创作出高质量的文章作品。总之,成为一名优秀的文章写作高手需要不断的努力和实践,同时保持对写作的热爱和专注。
金融大模型提示工程探索与实践
AI金融助手

金融大模型提示工程探索与实践

这篇文章介绍了一种金融领域的大模型提示工程探索,由文因互联提示工程实验室开发。该实验室利用S²PI框架,提供实时调试功能,尤其关注模型对金融特定语境和术语的理解能力。通过针对金融领域的不同场景和业务需求定制提示词,提升金融大模型的应用效果和准确度,以满足金融行业对AI的高标准要求。
金融领域内的大模型竞争:cost-effective智能副驾驶
AI金融助手

金融领域内的大模型竞争:cost-effective智能副驾驶

这篇文章主要讲述了公元2023年,金融领域中通用大模型竞争激烈,各路英豪争相深入理解场景、业务和人性,展开了一场PK赛。同时,探讨了大模型在成本问题上的挑战,指出虽然自建模型成本高,但专业领域的模型具有其优势,可以提升业务效果,从而降低综合成本。文章强调,对于金融行业而言,大模型可以成为智能副驾驶,帮助提升工作效率。
大模型的浪头卷到了金融业
AI金融助手

大模型的浪头卷到了金融业

就在由ChatGPT引爆的国内“千模大战”激战正酣之际,与AIGC有着诸多契合场景的金融领域踏上了一条探寻行业大模型的变革之路。 今年3月,彭博社针对金融业推出大型语言模型BloombergGPT,立即引起国内市场对金融垂直领域大模型应用的广泛关注。继各互联网巨头躬身入局后,金融科技赛道的头部玩家们也开始马不停蹄的探路大语言模型。 5月,星环科技推出第一款面向金融量化领域的生成式大语言模型“无涯Infinity”,度小满开源国内首个千亿参数金融大模型“轩辕”;6月,恒生电子发布金融行业大模型LightGPT,将于9月底开放试用接口;最近,马上消费的自研金融大模型箭在弦上即将发布…… 在近百款大模型产品的激烈交锋下,通用大模型的求解能力日益趋近同质化,也让大模型在特定行业的落地奔跑成为新赛点。 那么,“金融大模型”这条路究竟如何走通?又将给金融行业带来哪些惊喜和挑战? #01 探路“金融大模型” 月初刚刚在上海落幕的WAIC上,“大模型”无疑成为今年厂商、与会者屡屡提及的热词。大会期间,来自各家厂商的30多个基础大模型、垂直大模型集中亮相,让眼下这场“千模大战”的硝烟味又重了一分。 在让人眼花缭乱的通用大模型之中,垂直于行业的大模型可谓是今年大会的亮点之一。马上消费CTO蒋宁在现场接受媒体采访时表示,大语言模型技术出世后,对金融行业的人工智能技术应用无异于“强心剂”。 在他看来,金融行业有着数据密集型、技术密集型的天然属性,一直在探索数据资产化,挖掘数据价值,同时又面临着如银行线下网点的价值传递效率问题、用户体验问题,需要机构持续创新。 基于这些行业特点,也注定了大语言模型技术将会为其带来新的赋能。3月底,BloombergGPT的发布标志着ChatGPT引爆的AI热潮已一路蔓延到了金融圈。 据彭博社发布的报告指出,这一专门训练用于金融领域的大语言模型(LLM),训练中在金融任务上的表现远超过现有模型,且在通用场景上的表现与现有模型也能一较高下。 这将意味着,LLM正在迈向结合具体行业和特定场景进行垂直落地的新阶段,不仅是其实现商业化跃迁的关键,更是整个产业大爆发的重要一步,这也引来国内金融科技厂商迅速跟进。 “对比于通用大模型的能力而言,金融行业非常需要垂直行业大模型。”在不久前召开的2023全球数字经济大会上,度小满CTO许冬亮也给出了自己的看法。 他认为,囿于金融行业在数据安全隐私、风控、精度以及实时性等方面要求较高,使得通用大模型在金融能力上缺乏必要的训练数据,从而对金融常识、生成的可控性和准确性都达不到这个行业的最低要求,因此需要针对金融机构定制的行业大模型去发挥效力。 作为抢先一步试水的头部玩家之一,度小满在5月下旬推出了国内首个垂直金融行业的开源大模型“轩辕”。该模型基于1760亿参数的Bloom(决定输入数据如何转换为输出内容的变量)大模型基础训练而来,相较于通用大模型,在金融名词理解、金融市场评论、金融数据分析和金融新闻理解等金融场景任务上的表现可圈可点。 下水的显然不止度小满一家。6月28日,恒生电子金融行业大模型LightGPT也首次对外亮相。恒生电子董事长刘曙峰表示,大模型是信息技术的最新突破,刷新了人们对机器智能的认知,同时也在刷新行业应用传统AI模型的模式。 在“千模大战”背景下,随着各路金融科技企业在大模型的不断试水,金融业数智化的发展也悄然走向了一个从量变到质变的新阶段。 #02 生成式AI浪潮能力涌现 大模型时代,算力、算法、数据构成了新范式的“三驾马车”,其中,数据更可视为决定大模型质量和商业化落地的核心要素。作为一个业务流程规范、数据和知识沉淀完备的行业,金融业天然具有应用大模型的基础优势。 回顾过去十年金融业的发展浪潮,是一场涉及到整个金融产业的信息化和数字化革命,为人工智能的渗透融入奠定了基础。近年来,在智能营销、智能风控、智能投研、智能客服等领域,基于机器学习驱动的建模能力都是金融机构数智化转型翻涌的浪花。 当下以生成式AI为代表的第二波人工智能浪潮席卷至金融业,大模型所积聚的“三驾马车”也已从量变走向质变。 在近日恒生聚源主办的“大模型在金融行业的应用与展望”研讨会上,恒生电子高级副总裁、恒生聚源董事长王锋表示:“传统的AI模型,参数量少,通过大量的数据标注、大规模的模板配置来实现。换一个场景就要再重新来过一遍,泛化性不足,被诟病为有多少人工,才有多少智能。而大模型基于GPT——生成式预训练tranformer技术路线,通过预训练、微调、奖励模型、强化学习四个主要步骤和千亿级别参数规模,做到了令人惊艳的效果,也就是我们所说的能力涌现。” 这种能力涌现如今正赋能在金融云产品的方方面面。 如在AI开发层面,大模型展现出强大的代码自动化生成能力,颠覆了传统的“手工作坊式”模型,极大提升了机器学习的开发效率和生产模式;在智能交互方面,大模型的语音识别率不仅精准,还能凭借着深度语义理解与生成能力,快速解答客户复杂且专业性的问题;在分析决策方面,有着强大信息挖掘能力的大模型,能在风险决策、信用评估、反欺诈等场景,触及小模型无法覆盖到的区域。 申万宏源证券研究所所长助理刘洋认为,在算力、算法、数据“三驾马车”的推动下,工程化能力变得尤为重要,特别是在券商、基金这样的垂类大模型应用场景下,率先为客户提供服务的厂商将抢占先机。 因此,金融大模型的落地应用也成了市场当下所聚焦的关键一步。 #03 落地商业化尚需时日 尽管业内普遍认为,大模型将是开启金融领域“iPhone时刻”的按钮,但摆在眼前的事实是,现下的“金融大模型”主要停留在工具层和应用层,更类似于业务流程优化助手,在核心金融业务场景的落地之路任重而道远。 作为一个受到强监管的行业,金融业首先对于技术应用的安全性、稳定性、可控性等要求远比其他行业更为严格。尤其是在考虑到数据的安全与合规问题,意味着前期的数据采集和“清洗”等工作,厂商可能需要花费更多的时间和精力。 在马上消费CTO蒋宁看来,挑战主要现有大模型难以在金融特定领域实现落地的挑战主要来自四个方面: 一是当前的大模型在面对动态且不可预期变化的金融各项业务时,还并不能做到每一份决策都稳定、精确;二是金融行业往往希望为用户提供个性化的服务体验,但这需要个人隐私数据和大模型相融合,涉及到合规和安全问题;三是金融行业一直存在的“数据孤岛”问题,大模型要求构建增强学习的网络化平台,并持续贡献数据和反馈,但目前背后市场的数据生态是割裂的,仍然需要持续性的探索;四是金融行业大模型应用对底层设备、基础架构等软硬件设施提出更高的要求。 对于上述挑战,他认为可从强化学习和持续学习技术、鲁棒性决策、组合式AI系统技术等三个大模型领域的关键技术入手。 他进一步解释道,强化和持续学习会让系统越用越聪明,这就在于大模型幕后自适应的生态能力建设,鲁棒性决策则是实现关键决策的持续稳定和合规可信的核心环节,组合式AI系统技术可以有效结合各种垂直领域的判别式模型的可用性和专业性,助其真正发挥大模型的泛化能力优势。 基于上述认知,马上消费在探路金融大模型方面制定了“三横三竖”战略。据蒋宁透露,目前公司已开发了智能生成报表的工具产品,在智能客服场景上也有所涉猎,并即将发布自研的金融大模型。 最后关于行业最受掣肘的数据质量和合规问题,奇富科技首席算法科学家费浩峻此前在接受《中国经营报》采访时表示,对于数据质量问题,可以从数字化改造的源头进行标准化建设,并且设置有严格一致性的评估指标和方法。而在合规方面,商用级需要重点解决的问题是轻量级和易用性。 显然,对于刚刚迈入数智化“深水区”的金融业而言,尚需要一个适应到不断完善的过程,这也需要身处水中的厂商们拥抱合作互通,共同迎接大模型时代的到来。  End 你对“金融大模型”怎么看?留言区见~