AI金融公司赚钱难的「原罪」
AI金融助手

AI金融公司赚钱难的「原罪」

深度学习的强大之处在于,在参数化的神经网络里,工程人员可以实现任何复杂的变换。但是,数据与算法不安全性,就像是深度学习这项技术的阿喀琉斯之踵。 “几乎所有的AI企业都没有赚到钱,而根源问题在于人工智能技术本身的缺陷——数据与算法的不安全性。” 对于目前AI企业的生存困境,清华大学人工智能研究院院长张钹院士的这番话很直接。张钹院士向雷锋网《AI金融评论》说到,在AI技术驱动的产业中,全球前40个独角兽企业遍布了所有的领域,估值70亿到500亿之间。然而,这些独角兽都面临的问题在于:估值极高、销量极小,一家100亿估值的企业,其销售额不到一个亿。这不是国内知名学者第一次直陈AI产业的问题。事实上,深度学习的不可解释等“原生性”的问题,在目前看来,仍然没有很好的解决办法。即便是金融这样有着较高信息化基础、问题定义更加清晰的领域,再快的落地速度也掩盖不了AI的可靠性、安全性、可解释性等问题。 同时,银行等金融机构对数据的“敏感”程度和监管力度,让数据几乎没有离开本地的可能,不解决数据安全与隐私保护的问题,AI企业赋能金融的未来,也必然囿于数据孤岛之中。 诸多的AI企业,困在了“数据和算法”里。 深度学习的“阿喀琉斯之踵” 当前,AI基础设施建设的重心集中在数据平台、算力平台上,主要为各类AI解决方案提供基本的运算条件,为AI提供基础生产力,相当于是解决了AI的温饱问题。在这些基础设施的支撑下,数据和算力的快速增长作为“外部驱动力”,带动了AI产业在包括人脸识别、语音识别等领域的一波浪潮,驱动AI产业“第一增长曲线”的出现。但是,传统行业由于场景复杂和隐私保护等限制,真正可以使用数据往往并不充足,同时算力的增长也解决不了算法能力上限的问题。深度学习发展到今天,一个核心特征是神经网络模型变得越来越复杂,训练集越来越大。例如,今年最火爆的AI机器是GPT-3。GPT-3的网络层数可以达到96层,参数可以到1750亿,模型大小700G。经过了将近0.5万亿个单词的预训练,在不进行微调的情况下,GPT-3可以在多个NLP基准上达到最先进的性能。张钹院士表示,深度学习的强大之处在于,在参数化的神经网络里,工程人员可以实现任何复杂的变换。“换句话说,任何一个图像、文本输进去,都可以用参数化的神经网络将其变成所需要的结果。不管多么复杂,因为这是一个通用的函数映射。”但是,数据与算法不安全性,就像是深度学习这项技术的阿喀琉斯之踵。张钹院士表示,算法不安全的原因主要有三点:特征(伪语义)——语义空间映射是多对一;语义空间不是距离空间,是离散的层次空间;缺少语义的基于条件概率建模的“黑箱”学习方法;而这三点原因也决定了AI模型的推广能力很差。“马跟石头的语义距离很远,但是在形式空间里的距离又很近,形式空间里做出来的区别,不能保证在语义空间是安全的。这就是为什么AI模型非常容易受到干扰的攻击。这也就造成现在企业为什么难以做大做强,必须扩大应用产品的安全性和鲁棒性。”RealAI联合创始人刘荔园向AI金融评论表示,AI的可靠性、安全性不高带来的深层次问题在于无法应用到关键场景中的核心问题上,核心决策问题,一定对AI的这些要素要求非常高。她认为,用户并不是需要一个工程化的机器学习建模平台,而是不管有没有这个平台,都能知道业务可解释的点在哪里,保证模型上线之后是可控的。这是RealAI选择切入的市场。因此,RealAI想要解决的是各个行业的核心——“决策”问题,而要解决这样的问题,不单是需要提供算法能力,同时还有AI应用可控方面的因素共同支撑。这也就是清华人工智能研究院提出“第三代人工智能”的出发点。在2018年的CCF-GAIR峰会上,张钹院士就提出,今后发展的方向是把第一代人工智能知识驱动的方法和第二代人工智能数据驱动的方法结合起来,发展安全、可信、可靠和可扩展的人工智能技术,从而推动人工智能的创新应用。从这个角度来说,第三代人工智能技术体系,包括了贝叶斯深度学习、可解释机器学习、AI安全对抗攻防、新一代知识图谱、隐私保护机器学习等技术。就以贝叶斯深度学习为例,通过对变量之间的关系及神经网络参数进行概率建模,将数据和预测结果中天然存在的不确定性纳入算法,从而实现可靠、可解释的AI。清华大学人工智能研究院基础理论研究中心主任朱军教授评价到,它(贝叶斯深度学习)既有贝叶斯本身的可解释性,可以从少量的数据里边来学习;另外又有深度学习非常强大的拟合能力。 支付宝首席科学家漆远也曾向AI金融评论强调,AI发展方向之一,是必须成长为经得起攻击的博弈智能体,而贝叶斯机器学习就是将不确定性和小概率事件的研究,和推理能力、理解能力结合到一起,实现对AI对抗攻防能力的提升。 地平线机器人创始人兼CEO余凯也曾表示,深度神经网络其实更加适合做感知,而贝叶斯理论的核心是推理,只有从感知到推理才能到决策。因此,未来的AI发展需要拓宽“数据”和“算力”之外的维度,在相同的数据、算力条件下,更好的支撑AI赋能行业的深度应用,打开AI产业化全新的市场空间。 搭建AI的原生基础设施 近日,由清华大学人工智能研究院、北京智源人工智能研究院、瑞莱智慧联合主办的“2020第三代人工智能产业论坛暨瑞莱智慧RealAI战略发布会”在北京召开。本次战略发布会上,隐私保护机器学习平台RealSecure和人工智能安全平台RealSafe2.0版本相继发布,而发布这两款产品的公司——瑞莱智慧RealAI,则是一家从清华园里走出来的AI企业。瑞莱智慧CEO田天是清华大学计算机系博士,曾获评西贝尔学者,清华大学特等奖学金,为计算机系十余年间唯一研究生获奖者。他向AI金融评论表示,在应用中碰到技术难题时,我们不是见一个解决一个,修修补补;而是发现一个问题就看到一类问题,并通过底层技术框架、平台的突破,帮助产业进行升级。从全行业内来看,RealAI的出身和这种“平台化”打法,有些类似于国内的商汤:2001年,商汤创始人汤晓鸥教授一手建立了香港中文大学多媒体实验室,深入探索计算机视觉领域的研究工作,这间实验室的初创团队就是成立商汤科技的前身。RealAI则是依托清华大学人工智能研究院设立的人工智能企业,由清华大学人工智能研究院院长张钹院士、清华大学人工智能研究院基础理论研究中心主任朱军教授共同担任首席科学家。从研发背景来看,两者都拥有国内最顶尖的技术、人才资源。“学者型”特质的公司强在科研和技术能力,可以直接定位到AI产业发展的最前沿,而这类公司的最终目标是实现平台型产品的AI赋能,一旦成功,想象空间巨大。但是,除了“学者型”气质浓厚的创业公司,AI行业里还有诸多“接地气”的传统厂商。田天认为,渠道占优的行业厂商,是在传统解决方案的基础上加上一部分AI进行升级改造,进而快速实领域内的增量式提升。就以安防行业为例,无论是传统的安防企业诸如海康威视、大华股份,还是人工智能初创企业商汤、旷视等都在加大AI安防领域的投入。然而,如果AI能力不强或者只是实现一些“同质化”的浅层应用,在红海市场中会面临激烈的竞争。此外,AI在行业里落地,一大困难在于“应用场景的碎片化”,最终容易让创业公司沦为一个个的“项目制”公司,导致运营成本高居不下,难以实现技术和产品的高“复用性”。田天认为,正如社交领域的“微信”,电商领域的“淘宝”,平台型公司如果能选择一个好的方向,满足产业价值非常高的功能点,推广成本被摊薄后,成长速度会比聚焦在某个领域的公司更快。但是,走这条路线的公司,具备较长的布局周期和极强的技术和资源粘性,这对于一般的创业团队来说,是一个不小的挑战。 两款新平台:数据安全与算法安全 RealAI在这次发布会上共发布了两款新品,还是从数据安全和算法安全两方面入手。 首先是,隐私保护机器学习平台RealSecure。隐私保护机器学习平台:从“雕版印刷”到“活字印刷”数据安全主要涉及两方面:一是要解决隐私保护的问题,二是解决数据所有权的问题。 从实现第三代人工智能的思路出发,企业需要用更好的方法打通数据,保证数据隐私安全前提下最大化的挖掘数据价值。 这个过程中,受保护的、可用不可见的数据交互非常重要。在很多高价值商业场景,如金融、医疗、交通场景中,有价值的数据常常分散在不同的机构和用户手中,形成了大大小小的数据孤岛,明显制约了AI能力的提升。早在2016年,谷歌就提出了联邦学习的概念,可以实现“数据可用不可见”。近几年,在产学研的联合推动下,国内外诸多科技巨头,均已开始搭建联邦学习的研究与应用团队。国内也出现联邦学习、共享智能、知识联邦、联邦智能和异步联邦学习等多个相关研究方向,AI金融评论也以多篇文章和数次系列公开课,跟进隐私保护与数据安全的研究进程。RealAI所提出隐私保护机器学习与其同属一类技术范畴,但更强调隐私保护属性。不同于传统机器学习,隐私保护机器学习是分布式、密码学、人工智能三个领域的结合,这就意味着,企业想要做隐私保护机器学习,之前搭建起来的人工智能团队、经验等方法论不能直接拿来复用,需要重新搭建隐私保护机器学习体系下的团队与方法论。田天表示,重新堆人力将原有机器学习代码一点点的改写成联邦学习代码,这种方式显然并不落地,可落地的联邦学习平台,必须是与原有机器学习生态一脉相承的。而“一脉相承”有两层含义:一是算法的一脉相承,指机器学习算法与隐私保护机器学习算法应是继承关系,而非完全重构的关系,原有的AI算法积累,可以通过平台自动实现隐私保护化,实现两大生态的统一。二是应用的一脉相承,建模使用上需要符合原有数据科学家的建模流程,交互方式上既能支持UI的业务级一键建模,还可以支持以jupyter的形式建模,大幅度提高应用灵活度,让数据科学家能够以最熟悉的方式使用联邦学习。田天说到,数据科学家还是数据科学家,本地怎么建模、隐私保护就怎样建模,分布式、加密的工作全部一键自动完成。这也是RealAI推出隐私保护机器学习平台RealSecure(RSC)的两点考虑,据AI金融评论了解,这款平台是业内首款隐私保护AI编译器。以底层数据流图的视角揭示机器学习算法与对应分布式隐私保护机器学习算法的联系,通过“算子”组合将两端的生态打通,解决企业搭建隐私保护生态面临着的性能差、易用性差、黑盒协议等诸多难题。如何理解这里定位的“编译器”?田天解释道,在与传统处理方式相比,RSC能够将机器学习算法一键编译成隐私保护机器学习算法。“如果说此前的改写方式像‘雕版印刷’一样,RSC则实现了‘活字印刷’,将模型代码解构到‘算子’级别,通过算子的灵活组合来适配各种各样的机器学习算法,摆脱重复改写的繁琐工作,实现灵活‘制版’。”据AI金融评论了解,在底层编译的加持,以及融合密码技术与算法的优化,RSC能够实现性能的大幅提升。比如,在某实际风控场景中,RSC模型训练相比某主流国产开源框架性能提升40倍,耗时从4小时40分钟缩减至6分钟。人工智能安全平台:AI算法的“杀毒软件”现在,AI应用随处可见。目前市面上的手机均不同程度地配备了人脸识别方案;在公共场所,地方政府也已经部署了人脸识别摄像头,用于嫌疑犯追踪。最出名的莫过于“张学友的演唱会”,在2018年,张学友演唱会上就累计拿下了近80名违法犯罪分子。但是,随着人工智能规模化应用加速,其面临的安全风险也日益凸显出来。去年,RealAI就实现了通过一副印有特殊纹理图案的眼镜,解锁了他人的手机;针对安防监控的场景,通过穿上印有特殊纹理图案的衣服,就能逃过人体检测算法实现隐身。田天表示,目前,最广泛使用的深度学习技术,是通过查看数据集中许多的示例进行学习从而建立出模型的。与人类不同,深度学习模型没有可以利用的基础知识,它们的全部知识完全取决于训练的数据。当数据集中的数据被攻击者有意的操纵,植入秘密的后门时,模型就会学习到后门中的特征,比如图片中的向日葵。那么在实际运行中时,这个向日葵就会触发模型出错。解决人工智能安全问题的核心,在于理解为什么人工智能模型学习的模式如此脆弱。然而,对于广泛使用的最新机器学习算法(例如深度神经网络)是如何学习和工作的,人们了解得很少,即使在今天,它们仍然在许多方面仍是黑盒的。因此,RealAI推出了首个针对人工智能模型的“杀毒软件”和“防火墙”——RealSafe平台,一方面能够对模型的安全性进行全面检测,另一方面提供多种增强安全性的方案。在本次发布会上,RealSafe平台迎来2.0升级,在模型安全性检测方面,能针对对抗样本攻击,给出安全评分以及将检测场景从人脸识别拓展到了目标检测、图像分类外。此外,RealSafe 2.0还增加了模型后门检测功能,能够在不获取模型结构及参数等具体信息的情况下,分辨出仅在特定输入情况才会识别出错平时表现正常的被植入后门的模型。除了能够对安全性检测以外,平台也提供了安全性提升方案。 通过内置的对抗样本去噪方法,可以帮助用户在人工智能应用中,破坏掉攻击者恶意添加的图像噪声,使模型能够正常运作。 通过内置的对抗样本检测方法,可以帮助用户检测输入数据是否存在恶意添加的图像噪声,避免其进入人工智能系统的业务流程。 通过提供平台自动化生成的、能够使被测模型出错的对抗样本,帮助用户进行对抗训练,训练出更加鲁棒的算法模型。 目前,RealSafe平台已在工信部重大建设项目以及某电网公司落地应用。RealAI产品副总裁唐家渝表示,未来还将在RealSafe平台中集成更多安全风险的检测能力,包括数据逆向还原风险、成员推理风险、模型窃取等安全风险。虽然,AI算法界的“杀毒软件”这一说法由RealAI最早提出,但满足类似功能的产品在市面上也并非独此一家。比如,行业内早有一些人工智能对抗技术的工具包,例如foolbox、IBM的ART以及谷歌的CleverHans。田天认为,这些公司推出的技术,更多还是停留在学术研究阶段,还没有进入到商业应用的阶段。“很多学术机构发布的工具,是一种白盒的算法,如果要商用,要去检测某款AI系统的安全性,我们不可能要求对方把所有的源代码都给我们,他们会觉得更不安全。”因此,人工智能安全平台在提供检测方案的时候必须要具备“黑盒”的检测能力。据AI金融评论了解,RealAI目前在金融、工业、公共服务三大领域中进行布局。田天也向我们表示,这几大领域都有很好的机会,基本处于同步推进的状态。但是在落地速度上,金融领域会相对快一些。这也取决于金融业本身已有的信息化基础、金融问题的定义更加清晰。而在工业领域,由于这个行业的改造周期更长,项目推进的周期也更长。以金融场景为例,风控场景中数据有偏问题尤其突出,如何评估没有贷后表现的拒绝客群、挖掘其中的优质客户一向是行业难题。RealAI利用自研的半监督回捞模型,提高对拒绝客群质量的识别能力,实现捞回客群与原风控放款客群风险一致下,帮助金融机构无成本提升20%的资产规模。刘荔园也向AI金融评论透露,很多金融机构已经在使用黑盒模型,但是金融机构还是希望在可解释性上更进一步。“这个机会不仅仅是留给第一波吃到螃蟹的人,而是让更多的用户能够更安心、更大面积的使用这些模型。”田天说到,“短期内,我们需要做出一些效果突出的行业解决方案;长期来看,我们希望逐步把生态体系打造出来,对AI赋能所需要的各方面能力(算法、数据)进行集成,让解决方案提供商完成一系列AI应用的搭建,这个能体现出我们作为一家平台型公司的价值。” 推荐阅读
AI金融机器人
AI金融助手

AI金融机器人

不预判、不意淫、只跟随赚钱效应。 莫贫每天要念一遍,才可以写文章。 AI,机器人,金融轮着起飞。 核心票买不到,杂毛不想买。 曾经的强势股,这几天又不够强了。 比如拿着三丰智能,汇金科技,这2、3天赚不到钱。 今天又来一个万兴科技,今天挺强的,明天不知道。 今天去洗手间的时候,很轻松,因为股票输赢没多少钱,完全可以接受,好几年没这种感觉了,股市就是毁了我自己,我知道玩不过,也戒不掉,那就继续只拿一点钱搏一搏吧。 能走出来,1w可以变100w,走不出来,100w也一样变1w 看淡一点。 今天是2024年12月05日,第六届悟道杯比赛第20天,52人参赛剩余36人,退赛16人,目前7人赚钱29人亏钱。 第一名:不燕不语老师,今天赚5.35%,总收益率54.26%,从派瑞股份跑到捷成股份,分散了持仓,老师说这一次要冲上6w,7w,期待见证翻倍。 第二名:老猫投投机老师,今天赚1.74%,总收益率41.81%,哈投股份早上拉升反包以为要涨停没想到回落了,反手半仓多视觉中国,一起做AI的兄弟。 第三名:空空如也老师,今天赚6.45%,总收益率25.9%,继续格局汇量科技,AI起飞,空空如也老师就可以起飞,今晚发酵,明天又是起飞的一天。 帮在劵商上班的漂亮妹妹打个广告:万0.8开户,免5不能在这里说,懂的都懂,有需要的联系:mopin1998,两融利率是4开头,因为我这量大,所以优惠力度大。风险提示及版权声明: 本文刊登仅为个人信息记录,不构成投资建议。股市有风险,投资需谨慎。本文内容是基于本人认为可靠且已公开的信息,但不保证文中观点或陈述不会发生任何变更。在不同时期,可发出与这些信息所载资料、意见及推测不一致的内容。如转载使用,请注明来源及作者,文内保留标题原题以及文章内容完整性,并自负版权等法律责任。本号采用的图片部分来自网络,侵删。
《沪指 3400 点再启航:金融 AI 齐驱,多空博弈展新章》
AI金融助手

《沪指 3400 点再启航:金融 AI 齐驱,多空博弈展新章》

沪指重上 3400 点:多因素共振下的市场热潮 12 月 6 日,A股市场早盘风云突变,金融股仿若一阵强劲东风,强力驱动沪指摆脱近期的震荡区间,一举重新站上 3400 点重要心理关口。截至上午收盘,沪指报 3410.36 点,涨幅达 1.23%;深指收报 10825.2 点,涨幅 1.79%;创业板指表现更为突出,收报 2276.77 点,大涨 2.49%。从个股表现看,市场呈现出一片繁荣景象,全市场半日有近 4000 家股票上涨,占比超过八成,成交额达 1.15 万亿,较上个交易日大幅放量 2183 亿,量能的显著提升充分彰显出市场的活跃度与投资者的热情高涨。 板块表现方面,大金融板块无疑是早盘的领军者。银行、证券等金融权重股纷纷发力,例如华林证券强势涨停,其股价在早盘迅速拉升,带动整个证券板块人气飙升。保险板块也不甘示弱,多只保险股涨幅超过 5%。在金融股的示范效应下,AI 应用方向也迎来了爆发式增长,Sora 概念股领涨。天娱数科等多股涨停,这些公司在人工智能技术应用于数字娱乐、智能交互等领域有着积极的布局与探索,随着市场对 AI 商业化前景预期的升温,相关个股备受资金追捧。然而,市场并非全面普涨,部分板块则遭遇回调。如海南板块,由于前期涨幅较大且缺乏新的政策催化,出现一定幅度的调整;人形机器人板块受技术研发进展及市场竞争格局变化影响,股价有所下跌;汽车零部件板块因行业增速放缓预期,以及部分企业业绩不及预期,整体表现低迷;BC 电池板块则受累于行业产能过剩传闻,股价表现不佳。 回顾近期市场走势,此次沪指能够成功突破 3400 点,背后有着多方面深层次原因。一方面,近期政策面利好消息不断积累。例如,央行在公开市场操作中持续释放流动性,为市场提供了充足的资金支持;监管部门也出台多项政策鼓励企业创新发展、优化资本市场生态环境。这些政策措施犹如甘霖,滋润着市场的信心与活力。另一方面,当前已抵达年底两大重要会议的时间窗口。历史经验表明,在这样的关键时期,市场往往会预期政府将出台一系列刺激经济增长、推动产业升级的政策措施,从而提前在资本市场上有所反应,投资者也会基于对政策红利的期待而积极布局,推动股价上涨与指数攀升。 总之,在多重因素的交织影响下,A股市场正站在新的起点,未来走向值得密切关注与期待。
九一金融申请基于大模型的金融业务审核处理方法专利,提高金融业务审核处理效率
AI金融助手

九一金融申请基于大模型的金融业务审核处理方法专利,提高金融业务审核处理效率

金融界2024年12月9日消息,国家知识产权局信息显示,九一金融信息服务(北京)有限公司申请一项名为“一种基于大模型的金融业务审核处理方法”的专利,公开号 CN 119090461 A,申请日期为 2024年11月。 专利摘要显示,本发明涉及金融业务审核处理领域,尤其涉及一种基于大模型的金融业务审核处理方法,包括获取若干发送端发送的待审核业务数据,并对各发送端的待审核业务数据进行分析以提取待审核业务数据的业务特征数据;获取目标数据库中若干节点的节点特征数据;将业务特征数据和节点特征数据随机组合生成伪装掩码;将待审核业务数据和伪装掩码发送至监管端监管端在发送端发送待审核业务数据完成时,将目标数据库接收的待审核业务数据分配至目标节点;将监管端对若干待审核业务数据的历史监管过程中的待审核业务数据和审核结果作为审核数据集合以训练业务大模型,并基于训练后的大模型对后续待审核业务进行审核。本发明提高了金融业务审核处理的效率。 本文源自金融界
大模型技术对金融业意味着什么
AI金融助手

大模型技术对金融业意味着什么

来源:经济日报 大模型技术已经开始快速“渗透”到各个工作领域,金融业也无不例外。清华大学经管学院发布的一份报告显示,生成式AI正在席卷金融业,释放新的生产力,以前所未有的方式重塑全球金融业的格局。目前,我国已经有6家上市银行公开发布大模型技术开发与应用的信息。 金融业需要大模型技术吗?从匹配度上看,金融业是典型的数据密集型产业,而大模型技术的一大特征就是具有强大的数据洞察理解能力,可以缩短数据间发生连接与被计算的时间,提高数据创造价值的效率。如果把大模型的能力放在金融业中去处理原有的一些任务,会对很多工作产生提质增效的效果。 从重要性上看,金融业的高速发展离不开金融科技的赋能。近年来,我国在金融科技上取得了很多创新成果,金融业数字化水平大幅提高,移动支付、数字信贷等技术领域更是处于全球领先地位。金融科技是技术驱动的金融创新,眼下大模型技术和应用正在加速迭代和探索,可能很快催生更多新模式,未来能不能发展好、利用好大模型技术,对于深化我国金融业数字化转型,提升金融业核心竞争力意义重大。 可以确定的是,大模型技术在金融业的应用空间广阔。以关注度正高的“文生视频”大模型为例,仅用简单的文本指令,就能生成一段具有逻辑性、大片质感的短视频,有机会让投资者更易理解结构复杂、特征各异的金融产品,进而成为理财师、保险经纪人等金融从业人员的得力助手,提升服务效率和服务体验。更为重要的是,大模型技术有望在风险防控环节发挥出关键作用。一方面,金融机构可以通过大模型海量神经网络数据检测客户各类行为,提高自身风险管理决策能力;另一方面,金融监管部门可以利用大模型优秀的逻辑推理能力,协助工作人员提高对财务造假等违法行为的监管查处效能。 中央金融工作会议强调,要做好包括数字金融在内的五篇大文章。在数字化时代,强化金融科技创新已成为当前发展数字金融的必然选择,大模型新技术则有望成为推动行业创新的重要引擎。金融机构应尽快提高认识,从公司发展战略的高度积极探索大模型应用,逐步审慎加大相关业务投入,打造数字化人才团队,勇于挖掘新的应用模式,力争推动大模型与自身业务的有效融合,发挥出“1+1>2”的作用。但需要注意,任何一项新技术都是一把双刃剑,当前大模型在金融领域的应用仍处于早期阶段,更要做好风险防控,特别是要重视对用户数据隐私的保护,唯有安全可靠的技术才能真正助力金融业高质量发展。(本文来源:经济日报 作者:马春阳)
技术应用 | 大模型在金融领域的应用与安全研究
AI金融助手

技术应用 | 大模型在金融领域的应用与安全研究

文 / 上交所技术有限责任公司 陈洪炎 胡跟旺 卓航星 金融领域拥有天然的大量数据积淀,为大模型在金融领域的应用提供了良好的数据基础,因此金融行业大模型相较于其他行业的垂直大模型中落地速度相对较快。同时金融领域大模型的应用场景较多,大模型有助于从不同角度提升原有从业人员及机构的工作效率。大模型在金融领域的实践需要考虑多方因素,除了大模型技术框架对现有金融业务的效率提升以外,金融业务的专业性、严谨性、安全性及合规性要求对大模型在金融领域的应用实践也提出了更加严格的风险防控措施要求。 大模型的发展与应用 1.大模型架构。大模型最早诞生于自然语言处理领域,最开始自然语言模型通过神经网络预测单词,加入注意力机制后,使单词之间建立关系而考虑整句语言的含义,从而建立Transformer架构。谷歌和微软分别针对Transformer的编码部分以及解码部分进行研究从而产生了两条技术路线,即以BERT为代表的仅用编码器部分的路线和以GPT为代表的仅用解码器部分的路线。BERT与GPT都用到了预训练范式,预训练范式是指利用大量的数据训练一个基础模型,然后在下游任务上进行一点微调就能够在相应的任务上得到很好的性能表现。通过不断叠加数据并增加模型参数规模以及优化模型的提示工程,不仅可以解决更复杂的任务,同时也拥有了更强大的文本涌现能力。仅用编码器架构的大模型擅长对文本内容进行分析、分类,包括情感分析和命名实体识别,如BERT。仅用解码器架构通常用于序列生成任务,如文本生成、机器翻译等需要生成序列的任务,如GPT。为结合编码器和解码器的优点,出现了编解码器架构如T5和GLM。为了解决仅用解码器架构时内存占用高、响应慢等问题,微软提出双解码器Decoder-Decoder新型架构YOCO(You Only Cache Once),两个解码器分为自解码器(Self-Decoder)和交叉解码器(Cross-Decoder)两部分,以此来降低内存开销,提高性能及吞吐率。 2.大模型在金融领域的应用。随着硬件能力发展,算力已满足大模型的计算要求,大模型逐渐进入公众视野,大模型应用迎来了蓬勃发展,并在媒体影视、电商、广告营销、游戏、医疗、教育及金融等各行各业中得到广泛应用。大模型浪潮爆发后,国内各企业纷纷推出自研大模型。金融领域拥有天然的大量数据积淀,从而为大模型应用提供了良好的数据基础,大型科技企业如华为推出了盘古金融大模型,蚂蚁集团发布了金融大模型AntFinGLM。 金融行业的专业性、严谨性、合规性等特点,在把大模型技术应用到金融领域面临挑战,如:通用大模型的缺乏金融专业知识,通用大模型缺乏金融情境下上下文理解能力,通用大模型无法满足金融合规及监管等要求。金融机构在应用大模型到金融业务场景的过程中,一般需要经过两个主要步骤:一是从通用大模型进一步训练调优出专业的大模型;二是以大模型为核心,结合金融专业知识库、金融专业工具库、智能体、安全合规组件等构成一个可满足金融领域安全应用要求的应用系统,来支撑在金融大模型各场景中的应用。 3.金融大模型的开发框架。通用大模型在金融领域的适配一般需要经历数据收集、数据处理、在金融语义语境中训练通用大模型、参数微调、提高复杂推理能力、优化性能、减少幻觉、模型部署、模型评测、模型应用等流程。金融大模型开发框架(见图1)大致分为5个层次,即数据层、训练层、部署层、推理层和应用层。 图1 金融大模型开发框架 (1)金融数据收集。金融数据收集包括预训练数据、金融指令和安全数据。预训练数据主要包括广泛金融背景知识、语义语境认知等金融语料。预训练数据来源广泛,数据格式多样化,一般需要支持多模态输入处理。金融指令包括金融术语、指标计算、规范等专业知识。安全数据是为了满足安全合规要求,为保证大模型输出内容符合金融安全底线,遵从金融价值观而提供的必要输入数据。 (2)微调技术。从大模型参数规模来看,大模型微调分两种技术:一是全量微调(FFT),是对模型的所有参数进行训练;二是高效参数微调(PEFT)仅对部分参数进行训练。在金融大模型训练中较常使用的是PEFT,PEFT可以解决FFT带来的问题,即:FFT的训练成本很高,一般大模型的参数量较多,FFT相当于对模型进行了一次重新训练,FFT进行全参重训之后的大模型能力可能会变更差。PEFT的目的是能够在可控成本的前提下,尽可能地提升大模型在特定领域的能力。 (3)思维链增强。思维链(Chain of Thought,CoT)是通过让大模型逐步参与将一个复杂问题分解为一步一步的子问题并依次进行求解的过程,通过构建模型来模拟人类思考过程,形成一个连贯并符合逻辑的思维过程。CoT被认为是一种开创性且最具影响力的提示工程技术。但传统的CoT一般是线性链式结构,这限制了金融大模型在处理复杂金融领域任务时的推理能力,因此需要采用思维链增加技术(见表1)来提高推理能力。 表1  思维链CoT增加技术 (4)智能体。智能体是指能够自主感知环境、做出决策并执行行动的系统。智能体具备自主性、交互性、反应性和适应性等基本特征,能够在复杂多变的环境中独立完成任务。金融领域智能体可以分为三大模块:感知、记忆和行动。感知是从外界获取信息,记忆是存储知识、处理信息并做出决策,行动是向外界反馈信息。智能体自我反思是对智能体之前的活动进行回顾性思考,以纠正之前错误认知并完善行动决策。 金融大模型安全 大模型在金融领域的实践需要考虑多方因素,除了大模型技术框架对现有金融业务的效率提升以外,金融业务的专业性、严谨性及合规要求对大模型在金融领域的应用实践也提出了更加严格的风险防控措施要求。金融大模型安全挑战主要分为内生安全及应用安全。内生安全是金融大模型在研发过程中设计的基础设施、数据、模型、算法、训练过程、部署等环节中遇到的安全风险,而应用安全是金融大模型的不合理应用、滥用或恶意使用而引入的决策失控风险。内生安全问题应由大模型研发团队关注,应用安全则需要法律法规和行业管理规范来监管和控制。 1.金融大模型内生安全。金融大模型的研发生命周期可分为数据收集处理、模型训练、模型部署和模型落地应用四个阶段。其中数据收集处理阶段主要收集、处理、储存大模型训练需要的预训练数据、安全数据和金融指令等;模型训练阶段对海量数据进行预训练、调参、对齐、构建智能体等;模型部署是将训练好的大模型适配特定的硬件资源,并尽量提高大模型的实时性和推理效率;模型落地应用是用大模型解决各种实际的金融任务。 金融大模型的内生安全风险在不同的生命周期阶段有所不同,也有部分安全风险贯穿在全研发生命周期中(见表2)。在数据收集处理阶段,潜在数据泄漏、数据投毒等风险;在模型训练阶段,潜在后门攻击、数据泄漏、数据污染、模型篡改、模型窃取攻击、AI组件漏洞等风险;在模型部署阶段潜在平台漏洞、硬件漏洞、供应链投毒等风险;在模型落地应用阶段,潜在事实性错误、隐私泄漏、提示注入、对抗攻击、内容安全、大模型滥用、伦理安全等风险。 表2  金融大模型常见内生安全风险举例详解 2.金融大模型内生安全应对。金融大模型的安全风险多种多样,既有模型内部天然具有的不安全性,如数据泄露、隐私安全等风险也有外部的恶意攻击、大模型滥用等风险。为提升金融大模型的安全性、可靠性、公平性、隐私性、可解释性和鲁棒性,需要有相应的安全应对策略。内生安全应对可以从提升数据质量、强化模型学习、减少幻觉、安全评测和提升硬件安全等几个方面进行研究,以保证金融大模型的数据安全稳定、算法可解释、模型决策可信,应用合法合规和环境安全可靠。对于外部风险主要由国家法律法规和行业管理规范来进行监管规范。金融大模型安全框架是从全局视角剖析大模型训练、生产及应用中存在的安全风险问题,为大模型的研发及应用提供安全指导,其安全目标是构建可信、可控、可解释、可溯源的金融大模型,安全框架(见表3)主要包括大模型安全管理、数据安全、模型安全、环境安全和攻防安全。 表3  金融大模型安全框架内容详解 总结与展望 当前金融大模型发展尚不成熟,面临着诸多安全隐患与风险。可以预见,随着深度学习技术的发展和研究逐渐深入,未来大模型的攻防将在动态抗衡中不断升级,金融大模型需要应对的新型安全威胁将不断涌现和升级,建立完善统一的大模型安全评估框架、探索有效的防御机制、实现金融模型安全监管和可控生成,以及促进大模型安全生态的建设等任务迫在眉睫。 (此文刊发于《金融电子化》2024年10月上半月刊)
独家:2024年1-11月份金融行业大模型中标项目盘点,百度第一
AI金融助手

独家:2024年1-11月份金融行业大模型中标项目盘点,百度第一

2024年,大模型进入产业落地爆发期。作为数字化程度最为领先的行业之一,金融行业大模型落地速度也在显著提速。 目前,金融机构对大模型的应用态度非常积极。一个重要的例证是,银行、保险、证券等在内金融机构发布的大模型招投标项目数量相比前年初的几个月出现了明显增长。 2024年1-11月份,智能超参数统计到了100多个金融机构发起的大模型相关采购中标项目。从中,我们可以一窥大模型技术在金融行业的最新落地进展。 金融行业大模型落地显著提速,百度领跑厂商中标榜 2024年1-11月份,我们统计到103个金融行业大模型中标项目,其中39个未披露中标金额(为便于统计,中标金额标注为0元),其余64个项目披露中标金额为20083.58万元。 从季度统计的中标项目数量和金额来看,今年下半年金融行业大模型落地显著提速。第四季度,我们仅统计了2个月的数据,但中标项目数量已经逼近第三季度,并且中标金额创下新高。 随着金融行业大模型中标项目数量达到一定规模,行业的领军厂商也逐渐显现。在智能超参数长期跟踪的6家知名通用大模型厂商中,百度表现突出,在主流大模型厂商中,拿下最关键的中标项目数量、中标金额两项第一。科大讯飞紧随其后,项目数量和中标金额都排名第二。两家厂商形成市场上领先优势明显的头部企业。 在两家企业之后,其他4家厂商,智谱AI 、火山引擎、阿里云、腾讯云则项目相对较少,成为市场上的第二梯队。值得注意的是,以项目数据来看,可以进入第二梯队的厂商众多,华讯网络、南天电子、深擎科技、可利邦等厂商也都有3个中标的金融大模型相关项目。 大模型集中落地金融行业四大应用场景 从2024年下半年开始,金融行业大模型中标项目数量开始快速增长,显示大模型技术在金融行业的加速渗透。以中标项目数量计算,金融行业能够稳居前五大行业,其余四个行业是教科、通信、能源、政务。 虽然金融机构的采购预算相对宽裕,但目前金融行业大模型中标项目的金额整体上看普遍还不够大。排除未披露金额的项目后,其余项目披露金额的中位数在142.8万元,比全行业略高一些。 从项目数量来看,应用类项目 (其中可能包含算力、大模型等)数量最多(64个),占比62%;大模型类项目(16个),数量占比16%,算力类项目22个,数量占比21%,数据类项目占比最少。 从披露金额来看,应用类项目披露的金额占比也是排名第一,算力类占比第二,大模型类占比第三,数据类项目的占比最低。 应用类项目数量和金额占比最多,表明金融机构更多的注意力聚焦在大模型技术在具体业务场景中的落地。而数据类项目数量和金额较少,这可能跟金融机构本身数据治理就较为领先和规范有关系。 在大模型类项目中,一个明显的趋势是越来越多的金融机构在建设大模型底座或者AI中台。这意味着大模型在金融机构中越来越重要的角色,并且可能会渗透到越来越多的业务场景之中。 所有应用类项目根据场景进行进一步细化,智能编程(13个)排名第一,但是其跟业务场景关联性较小。在跟业务紧密相关的场景中,知识平台&知识生成 (12个)、数字人&客服( 11个 )、智能审核(5个)排名前三。 在知识平台建设这个场景上,百度目前中标案例较多。以泰康保险为例,该企业通过基于百度智能云知识管理平台“甄知”打造了私有化、新一代的泰康知识中台,把泰康过去沉淀的行业知识、多源异构数据接入进来,基于大模型能力,将企业知识在内部更高效地流动,内勤工作人员可以快速获取公司最新的福利制度、通知公告,保险代理人则可以实时获取专业保险理赔建议,获取最新保险政策等。 银行业领跑金融行业大模型创新 在我们统计到的103个金融行业大模型中标项目中,覆盖金融机构类型越来越多,其中包括银行、保险、证券、金科公司、交易所、消金、监管机构等。 从数量上看,银行类机构发起的大模型相关采购项目数量最多(58个),占比达到 57%,其次是证券机构(15个),保险(13个),其他金融机构(17个)。披露的中标金额占比上来看,银行、证券稳居前两名。 从大模型项目的建设目标来看,目前大模型的落地尝试更多聚焦在金融机构的对内赋能上,比如加快合同的智能审核、企业知识高效获取与分享、提升智能运维效率等,但是也能看到部分企业开始尝试利用智能体进行一些核心业务上以前做不到的创新。 以保险行业为例,百度智能云基于10月新发布的工作流Agent探索、落地车险续保售前数字员工。过去,车险续保的工作指导包含大量流程、子流程、文档等内容,优秀销售人员稀缺,且培养周期往往长达一到两年。基于工作流Agent开发金牌销售数字员工,则最快可以在1小时内完成、上线,能够大幅提升企业车险业务的核心生产力。 目前来看,金融机构对于大模型技术的采用还处于智能风控、营销、客服、投顾等少数场景测试的阶段,一旦价值明确或者投资回报率可观,大模型技术可能才会逐渐深入到更多核心业务之中。当然,这个持续渗透的过程,还受到大模型技术进一步成熟,安全性提升,以及行业规范不断完善、监管政策明朗等因素影响。 最终,大模型在金融行业要真正发挥比较大的业务价值,还是得在直接面向客户的核心领域和场景里面,跟场景进行深度融合。如果只是泛泛地谈金融大模型,那就做不到有的放矢,并且对内使用和对外使用大模型技术,也有着明显不同的业务规则、数据安全规范、以及监管要求等。 现在可以肯定的一点是,明年将是一个关键时间节点,因为2024年诸多金融行业大模型落地案例将会迎来盘点价值的阶段。如果大模型能够证明价值,那么凭借金融行业机构的强大购买力,2025年将会是大模型在金融行业的爆发时刻。 说明:部分中标项目未披露中标金额,为方便统计,项目金额以0计算;此外可能存在统计遗漏,项目分类、行业分类等也并不严格,这都可能会影响最后的统计分析结果,请读者知晓。仅供参考。
宇信科技:与智谱AI建立密切合作,推出金融行业大模型应用产品和解决方案
AI金融助手

宇信科技:与智谱AI建立密切合作,推出金融行业大模型应用产品和解决方案

金融界12月10日消息,有投资者在互动平台向宇信科技提问:董秘您好?贵司和智谱AI有合作?主要在哪些方面展开合作?谢谢。 公司回答表示:目前公司与智谱A已I建立密切合作关系。公司非常重视大模型在金融行业的应用价值和落地方案。 公司通过自主研发率先推出了首批金融行业大模型应用产品和解决方案,包括4个应用级产品和1个开发平台。公司积极与合作伙伴协调拓展在金融行业的方案和产品落地,已中标了某消费金融公司的智能营销服务项目,将运用先进的AI技术,帮助该客户实现更精准的用户洞察和营销管理,提升运营效率的同时,促进获客与转化。 公司将持续推进生成式AI带来的产品和业务升级机会,拓展市场,不断进行迭代完善。 本文源自金融界
业界:探索大模型金融应用场景 以安全管理推动有序发展
AI金融助手

业界:探索大模型金融应用场景 以安全管理推动有序发展

来源:人民网 人民网北京12月6日电 (记者杜燕飞)“我们要积极拥抱新技术,加快数字化转型。”“加强安全管理,保障大模型有序发展。”日前,第二届大模型金融应用创新与实践大赛在京启动,旨在分享金融业大模型应用的前沿实践,探索金融应用场景,评价金融应用效果。 参会嘉宾表示,希望通过活动的举办,为行业提供展示和竞技的舞台,通过交流形成发展的共识、以他山之石拓思路,筛选出具有影响和推广潜力的优秀方案。同时,加快构建促进金融科技核心技术成果转化的平台,激发大模型在金融领域的应用场景创新和生态构建。 “我们将为参赛者提供必要的算力、模型及数据支持,以实战演练的方式提升大模型的应用效能,形成可工程化实施的解决方案。”奇富科技CEO吴海生表示,“近年来我们积累了数据安全实战的经验和技术能力,采取数据加密、脱敏处理、隐私计算等方式,建立了数据管控体系,重视数据全生命周期管理,保障用户的数据安全及财产安全。在今年中国互联网金融协会发布的《金融数据安全治理实施指南》标准中,我们担任了主起草单位的工作。希望通过不断探索,推动大模型在金融应用领域的安全发展。” 第二届大赛由北京金融信息化研究所联合北京市西城区总工会、青岛市金家岭金融区管委会、北京金融科技产业联盟等机构共同举办,奇富科技等承办。 据介绍,在2024年初举办的首届大赛中,共收到来自工商银行、农业银行、中国银行、建设银行、蚂蚁科技、百度网讯、腾讯云等39家机构68份应用实践报告。经公开征集、初赛筛选、专家终审等环节,最终评选出10篇十佳卓越案例,11篇十佳优秀案例和4篇创新实践案例。
金融科技新浪潮:大模型驱动下的资产管理与财富管理创新应用场景与实践案例发布
AI金融助手

金融科技新浪潮:大模型驱动下的资产管理与财富管理创新应用场景与实践案例发布

在12月6日举行的2024滴水湖新兴金融年度大会上,《上海全球资产管理中心建设 资产管理大模型应用实践与指南》(以下简称《实践指南》)正式发布。 《上海全球资产管理中心建设 资产管理大模型应用实践与指南》 发布仪式 在中共上海市委金融委员会办公室的指导下,在中国(上海)自由贸易试验区临港新片区管理委员会特别支持下,为了进一步贯彻落实《上海高质量推进全球金融科技中心建设行动方案》,上海资产管理协会、智能投研技术联盟(ITL)联合多家成员机构共同撰写《实践指南》。为进一步推动大模型在资管领域、财富管理领域的应用深入,加强行业与基础大模型、垂类大模型机构的交流与合作,致力于为行业提供一套全面、系统的实践指南和技术指导,以促进大模型技术在资产管理与财富管理领域的健康发展,资产管理与财富管理创新应用典型场景与应用实践案例同时发布。 创新应用典型场景提炼了大模型在资产管理、财富管理领域落地的基金投研助手、投资顾问助手、财报分析助手、风险合规助手、智能化办公等16个典型应用场景。聚焦资产管理与财富管理领域大模型应用实践现状、挑战及机遇,汇聚了来自银行及银行理财、证券及券商资管、公募及私募基金、保险资管、科研院所、大模型科技公司、法律服务及审计机构等众多资产管理、财富管理领域专家的智慧和实践经验。 创新应用实践案例展示了15家金融机构在银行及银行理财、证券及券商资管、公募及私募基金、保险资管实际业务中的大模型应用案例,聚焦应用落地效果和业务价值。分析了大模型技术的演进历程及其在资产管理与财富管理领域的应用潜力。讨论了大模型在资产管理和财富管理领域的应用现状。提出了资产管理与财富管理领域大模型应用的建设路径。涵盖了风险合规管理、安全与伦理问题防范、人才培养以及资产管理与财富管理领域大模型应用测评指南等重要内容。 数智技术在快速发展,金融资管业务在不断开拓, 技术与业务融合发展空间很大,永无止境, 需要行业不断进取,牢牢把握新技术前沿应用。相信大模型技术将在资产管理与财富管理领域发挥越来越重要的作用。希望典型应用场景与应用实践案例能够为资产管理和财富管理行业的决策者、管理者、技术人员提供参考和启发,有助于资产管理和财富管理行业机构有效利用大模型技术,支持提升投研工作效率,增强风控管理能力,尽可能满足客户服务体验,同时确保合规性和安全性要求。 2024滴水湖新兴金融大会 扫码关注我们 特别声明:本文经上观新闻客户端的“上观号”入驻单位授权发布,仅代表该入驻单位观点,“上观新闻”仅为信息发布平台,如您认为发布内容侵犯您的相关权益,请联系删除!