行业洞察 | AI在金融领域:技术引领未来的同时,面临人才和数据的双重挑战
AI金融助手

行业洞察 | AI在金融领域:技术引领未来的同时,面临人才和数据的双重挑战

 目录 01. 引言 02. AI+金融:特点 03. AI在金融场景中的角色探索 04. AI+金融:挑战与展望 05. 总结 06. 参考文献 引言全球对人工智能的兴趣激增,在大洋彼岸的人工智能狂热中,如人工智能初创公司Inflection完成逾十亿美元的融资,同样规模的融资也发生在初创公司MosaicML ,以逾十亿美元被Databricks所收购。在金融领域,OpenAI等人工智能厂商在过去数周继续主导着国外金融市场的AI新闻。穆迪携手微软和OpenAI合作,推出AI助手,帮助客户评估风险。瑞穗银行让员工使用Azure OpenAI,成为日本首家采用该技术的金融公司。然而,如光锥智能(2023)所描述,“资本市场一冷一热所折射的,正是身处发展初期的中国AIGC产业,面对商业模式不清晰、技术层面的不足,大批国内创业者仍征途漫漫”,尽管人工智能已成为科技领域的投资热点,但国内市场对人工智能的态度似乎从近几个月中国初创企业的爆炸性增长的景象慢慢发生了改变,在算力发展受限等新的限制下,国内AIGC赛道的发展又将面临新的挑战。AI创业者将在金融赛道中看到的,可能不仅是机会,其中也会看到行业中存在的特定门槛,以及一些面临的挑战。从年初到现在,非凡产研持续与AI赛道创业者及投资人保持深度交流和交易参与,并有幸采访到摸象科技、有连云、飞笛科技、熵简科技、深擎科技等在AI赛道中的优秀企业,探讨他们在金融行业中的经验和认知。本文将从AI与金融场景结合的角度,结合访谈内容,探讨AI赛道中金融领域的独特性,体系化地呈现这些公司如何利用AI在金融赛道实现价值。AI+金融:特点 • AI与金融场景的结合,是金融科技的具象体现 • 关于AI与金融的结合,中国人民银行2019年发布的《关于金融科技(FinTech)发展规划(2019-2021年)》中描述,金融科技属于金融与科技的深度融合。深度研发信息技术、人工智能、大数据、区块链等科技,并创造性使用,金融科技将在金融市场优化、服务水平提升、服务领域拓宽,及风险防范中发挥关键角色。作为基于技术带来的金融创新,金融科技具有颠覆业务模式、业务、流程与产品的潜力。人工智能与机器学习过去主要服务于金融行业的信用评估和基础欺诈评分。新一代人工智能通过大型语言模型(LLM)处理非结构化数据能力和强大的算力,已为众多行业带来前所未有的赋能。一方面,金融行业、机构及公司拥有庞大的、覆盖多行业的历史数据,为训练行业模型提供了坚实的基础。然而另一方面,出于信息安全及合规的需要,金融行业往往更为谨慎。目前,在金融行业的数字化转型的进程中,人工智能充当着日益重要的角色。作为目前集合庞大、广度深、复杂度且增长快速的技术学科,人工智能与金融场景的融合,可以说是金融科技的最具象体现。金融科技中的人工智能是利用人工智能进行金融数据分析、客户服务、供应链管理、交易建议等诸多领域的应用(Editorial Team,2023)。据The Business(2023)统计,全球金融科技领域的人工智能市场规模从2022年的91.5亿美元增长到2023年的115.9亿美元,年复合增长率(CAGR)为26.8%,预计金融科技领域的人工智能市场规模将在2027年达到317.1亿美元,年复合增长率为28.6%。AI创业者将在金融赛道中看到的,可能不仅是机会,其中还包括行业中存在的特定门槛以、未来的挑战。 • AI与金融场景的结合,有它特定的门槛 • AI与金融场景的结合,有它特定的门槛,具体体现在人才、数据及技术壁垒、信息安全与合规等维度。2.1 关于人才AI与金融结合,不仅需要复合型人才,还对业务Knowhow有一定要求,以便更好地理解金融行业的逻辑和需求,这也是人才门槛的主要体现。在专业水平方面,AI与金融结合不仅要求AI具备足够的领域专业度,还要求人具备金融知识、金融工程、投资等方面的专业知识。从专业度角度,飞笛科技丘慧慧表示,金融价值一方面体现在其让实体经济获得资金的支持,让实体经济得到持续增长;另一方面让资金的持有方合理投放,保持资产增值。从专业性角度,金融行业是信息行业中专业度、场景密度及频次都最深的行业,金融本身不直接创造价值,但它会赋能实体经济,它本身的价值是资金使用效率提高赋能实体经济、让资产保持增值,因此对团队及人才的专业度有一定要求。从人才的复合角度,熵简科技费斌杰表示,AI在金融领域面临的核心挑战还是在人才端。这个行业需要更多的专业复合型人才,不仅对实战投研与数据科学知识的深度结合有较高要求,还要懂数据,比如具备调用模型、写Spark、Flink等技能。然而,这种级别的复合人才在市场上并不多。此外,相比人才的数量,质量可能更为重要,比如打造出优秀产品的OpenAI,其团队人数其实并不多,但每位成员都是超级复合型专家。这种顶级的跨领域深度复合人才,是推动企业乃至整个行业发展的关键,而这种顶级人才的竞争也是最激烈的。从专业与业务结合角度,有连云张岩阐述了AI技术应用与细分领域产品落地的关系。一方面金融领域对专业度要求较高,创业公司的团队构建往往需要懂金融且有技术开发背景的架构师等人才。另一方面,产品的落地需要技术与场景理解相结合,这要求团队能了解客户需求、并能够针对性地解决业务开展过程中的困难。其次,基于对业务的理解调整对应分工是充分发挥复合型人才的潜能的关键。2.2 数据、技术壁垒&信息安全与合规数据壁垒方面,金融行业的数据质量要求非常高,数据的准确性直接影响到金融决策的结果。AI需要能够从大量的数据中提取出有价值的信息,同时还需要确保数据的准确性和完整性。其次,金融行业的数据涉及到用户的隐私,因此数据的安全和隐私保护至关重要。此外,AI应用过程中,数据获取与合规也是备受关注的问题,其要求AI需要在合规的前提下获取和处理数据,确保数据的合法使用。熵简科技创始人费斌杰以模型训练为例,表示每个行业的私域知识对于训练领域大模型是最重要且不可或缺的因素,也是垂直模型在特定领域领先于通用模型的原因。如GPT-3的训练主要是包含common crawl等在内的数据集,然而这些通过公开的网站、渠道获得的数据集却很难满足于构建一个专业的数据库的要求。此外,这些私域资料的质量也分层级,训练模型的对这些数据的筛选和加工也有很高的要求。*common crawl:Common Crawl语料库包含通过12年的网络爬取收集的数千亿字节的数据。该语料库包含原始网页数据、元数据提取和文本提取。Common Crawl数据存储在Amazon Web Services的公共数据集以及全球多个学术云平台上。(OpenDataLab,2019,available from:https://opendatalab.com/Common_Crawl)技术壁垒方面,金融领域涉及大量的数据,包括股票市场数据、宏观经济数据、用户交易数据等。AI需要具备高效地处理和分析这些数据的能力。同时,基于大模型的技术底座,AI能更好理解金融领域的业务逻辑和数据结构,以便为金融机构提供准确、有效的解决方案。然而,金融场景下的AI模型需要在实际应用中不断进行优化和验证,这都需要专业的算法工程师和数据科学家去确保模型的稳定性和准确性。在信息安全与合规方面,飞笛科技丘慧慧从AI应用在内容科技业务的角度,阐述了信息准确度在传播过程中的重要性。金融领域具有其独特性,因其关乎国民财富的安全和收益,故而须受到严格的监管。在此背景下,容错率相对较低,这也意味着,如果机器或AI系统不能确保信息的准确性和来源的权威性,合规性将面临极大挑战。而在具体内容科技业务中,信息来自于对风险的识别和对机会的判断,包括对产业、公司的理解。在综合的传播环境下及传递的过程中,信息会发生发酵,产生共振,但同时,信息既可以引导价值和拉动需求,又可能被误解从而形成市场震荡。因此,信息、资金是影响、驱动整个金融市场的核心。且信息和资金流是互相影响的,专业性要求很高,每天瞬息万变,金融对信息的及时性要求非常高,也是它的一个门槛。深擎科技柴志伟表示,出于对金融行业独特性、数据安全及合规性的重视,中国的厂商在考虑海外大型模型在国内的应用时,表现得相对审慎。选择私有化部署的垂直领域模型,已经在AI模型层在金融领域发展成为一种趋势。金融机构对于通用大模型的运用,主要目标在于提升认知,然而,通用大模型的参数可能高达千亿级别,但垂直领域的模型参数可能仅需百亿。因此,私有化部署的要求仍然依赖垂直领域模型。在私有化部署方面,摸象科技高鹏表示,对于银行客户,出于隐私安全及数据监管的需求,一般行方会要求AI厂商提供私有化部署,即以私有云的方式替代公共云服务。这将对我工程产品开发带来较大的挑战。持续改进产品的性能,使其更容易运营和维护,从而降低私有化部署中的工程运维成本是AI厂商的工程团队所需要做的事情。有连云张岩介绍道,构建一个具备专业能力并符合低容错度要求的模型是富有挑战性的,它需要耗费大量的研发资源并进行反复的模型迭代和升级。金融领域的独特之处在于,金融领域对数据的时效性、准确性和稳定性要求很高,模型的数据时效性、准确性与稳定性对用户体验与客户黏性起着重要作用。对于数据安全及合规,熵简科技费斌杰表示,在金融领域,对人工智能模型的高度可靠性要求极为重要。AI模型在行业应用中的最后一公里正是其可靠性的问题。监管对于金融行业的厂商来说,并非一个需要战胜的挑战,而是一个引导性的框架、一个市场竞争的规则,以及一个行业的规定。为了符合监管要求并处理数据合规性,有许多可行的方法,例如发展开源模型将为整个行业带来福利,或者将模型部署在国家托管的监管云之上并为金融机构提供服务,此外,为金融机构在本地部署服务,也是值得考虑的一个方向。这些因素都有助于提高AI在金融行业应用中的可靠性。随着经网信办审议通过,并经发改委及相关部门同意于今年8月15日起施行的《生成式人工智能服务管理暂行办法》已将网络信息内容生产者的服务规范列入技术发展与治理要求当中,未来,对于AI的信息安全将会有更明确的框架规范与要求。总体来说,AI与金融结合的门槛主要体现在技术门槛、数据门槛、人才门槛和法规门槛等方面。只有克服这些门槛,才能充分发挥AI在金融领域的优势,为金融机构提供更加智能化的解决方案。AI在金融场景中的角色探索 • 主流技术及应用 • 目前AI在金融领域底层技术主要以NLP(Natural Language Processing自然语言处理技术)、“大型语言模型”(LLM,Large Language Model)、数据挖掘、数据加工(非/半结构化)等。艾瑞咨询(2022)把AI+金融的分为前、中、后台,分别从智慧营销、信用评估到模型开发及大数据层面,从机器学习及智能语音等维度剖析AI在银行、保险、证券等领域的具体角色。*LLM,Large Language Model一种通过分析亿级规模的语言数据或视觉素材,以进行知识提炼和模型学习的过程,最终构建出庞大参数量级的大型模型。在金融环境中,AI能够通过多种途径展现其效能。首先,在风险控制方面,AI可以对大量数据进行分析,协助金融机构进行风险评估并制定相应策略。例如,通过对客户的信用评分、交易记录、财务状况等信息的分析,AI可以为客户提供定制化的金融产品和服务。在投资研究方面,AI能够通过对历史数据的分析,为投资者提供行业和股票的预测和建议。此外,AI还能够在量化交易领域发挥作用,通过高频交易策略为投资者带来收益。更多的,在零售金融领域,AI可以用作智能客服,提供24小时在线咨询服务。通过自然语言处理和语音识别技术,AI能够理解客户的需求,提供准确的答案和解决方案。另一应用场景可拓展到营销业务,AI能够协助金融机构分析客户行为,为其提供定制化的营销策略。例如,通过分析客户的消费习惯和兴趣爱好,金融机构可以向客户推荐符合其需求的金融产品。 • 零售金融中的人工智能 • 零售金融作为银行的重要业务,与AI的结合将更有利于优化用户体验及提高效率。主要应用领域可覆盖信用评分与风险管理,欺诈检测与预防,个性化推荐与产品营销,智能客服与聊天机器人,聊天机器人营销,语音识别与虚拟助手,自动化与智能化运营,大数据分析等。摸象科技2007年成立的摸象科技,在大数据领域持续耕耘,最初采用谷歌开源Bert模型,结合深度学习+领域知识库平台,进一步压缩模型结构、增加并发数,构建了金融行业垂直模型。目前,摸象与高校联合自主研发的垂直金融的语言大模型,模型规模已达7B,可进一步扩展。训练的数据集垂直于零售金融方向,涵盖了金融知识图谱、金融文本、金融对话等多种数据源。摸象科技已为国内数十家省分行及股份行提供AI+金融数字员工解决方案,AI员工“象小秘”垂直于150个业务类目的场景,并被应用于银行营销和运营场景中。区别于传统RPA为后端提供自动化解决日常重复性任务的数字员工,摸象科技重点在于赋能员工实现人机协同,提升工作效率。 *RPA机器人:Robotic process automation,又称“RPA机器人流程自动化”“机器人过程自动化(RPA)”“软件机器人”,使用智能自动化技术来执行人类工人的重复性办公室任务。 △摸象科技AI员工赋能,企业供图 • 内容科技中的人工智能 • 有连云有连云国内领先的金融AIGC服务提供商,针对金融市场的时效性,致力于帮客户解决以sales and marketing为主导的应用场景问题,并把商业模式立足于解决开源层面的痛点。其中,有连云服务的客户群体主要包括金融机构与上市公司。金融领域的痛点与一般场景不一样,对准确度要求较高,有连云AI模型可以有效降低人为错误。△有连云场景及技术,企业供图深擎科技成立于2018年的深擎作为内容科技与智能营销服务商,运用人工智能、大数据及财经资讯运营能力赋能金融机构,提供从内容生产、加工、分发到触达运营全流程的解决方案。基于对金融业务场景的理解,持续性地为金融机构提供内容科技服务,通过个性化推荐、智能标签以及智能内容运营等产品和服务,帮助金融企业激活存量客户,提升用户体验,促进交易转化。公司创始人、CEO柴志伟介绍,针对券商及银行在吸纳新客户过程中面临的高昂成本和收益不稳定的问题,深擎的主要关注点在于提升用户活跃度和交易频次,从而保持用户粘性,而非单纯依赖于购买流量来实现用户增长。其中在财经内容生成和管理方面,深擎科技会把来自财经官媒、自媒体等渠道的资讯、视频进行聚合,再经AI和人工审核,每天20万篇新增内容进行AI审核(涉政涉敏,涉黄涉暴等),还包括金融行业的数据错误(如媒体记者在利润率、增长率等财务参数上的笔误)。柴志伟表示,金融行业受严格监管,对内容发布的要求非常高,并不是简单撤回就可以。具体案例可体现在某银行客群,通过深擎的内容赋能,在内容端UB提升95%,UV提升63%。*UB(User Behavior)是指用户的行为改进,包括用户在平台上的互动、使用频率、停留时间等方面的改善;UV(User Visits)是指用户的访问量,表示访问平台或内容的用户数量。△深擎科技解决方案矩阵,企业供图飞笛科技作为财经AIGC生成和分发平台,依赖基于全网财经信息的大数据引擎,飞笛将内容数字化+AIGC和AI投顾技术深度运用于赋能机构线上财富管理和买方服务中,强调以“买方”的视角设计数字化产品和服务,以帮助金融机构实现传统零售和经纪业务、财富管理业务的数字化转型,帮助用户获得更好的买方服务并实现可持续回报。对于金融行业在内容科技方面的痛点,飞笛科技丘慧慧表示,2016年后,金融机构曾经有一轮要做“垂直今日头条”的建设高潮,但金融机构本身没有那么多的数据,也没有足够量级的用户和足够量级的免费内容,很难依靠算法做到千人千面。其次,相比互联网平台容错率比较高的兴趣推荐,金融更偏向于是“价值推荐”,容错率低,彼时,基于专家系统的AIGC可以很好地解决该些难题,但并没有被充分运用起来,金融行业的那时候走的弯路现在仍在继续。现在新的一轮基于大模型的AI浪潮又来了,但是显然,上一轮没解决好的按“价值”逻辑进行生成和推荐的问题,大模型时代仍要率先面对并解决。飞笛将自身的竞争壁垒归纳为:基于全网海量信息大数据的实时“算力”,赋能金融机构内部场景下的数据治理、服务与内容生成、业务场景和用户个性化分发,以提升金融机构“运力”,提升机构运营的ROI和用户满意度。她特别强调,金融场景下,首先要解决AIGV,实时价值发现问题,其次才是AIGC,因为用户信息过载+金融信息高频的特点,通过外部信息数据能力的导入,为机构内部提升运营效率非常重要。数字化的运营决策力、内容生产力、按业务场景和用户的个性化分发力,都使得机构的整个运营过程变得更加敏锐且灵活。△飞笛科技数据-内容-智能交互流程,企业供图 • 投研中的人工智能 • 熵简科技主要服务于基金/资管、证券公司等机构的熵简科技,依托大数据、云计算、AI等技术,为资管机构提供智能投研辅助决策的工具,并实现投研数字化。熵简科技费斌杰以石油行业研究为例,对特定领域进行了深入分析。在分析石油行业时,中高级分析师会审视一系列高频指标,供需因素、页岩油信用债扩张周期、政治因素、沙特和欧佩克的减产计划等,都是石油行业的关键分析框架。在此基础上,仅仅简单地询问GPT可能无法获取详尽的信息,这对于投资决策是远远不够的。投资决策需要基于市场信息作出买入卖出决策,这也是为什么要在细分领域寻求专业化的原因。熵简科技又以海上风电为例,在研究该行业,补贴退坡、并网情况等都是重要指标,而再往前又可再追溯到一系列前瞻性指标(装机情况、吊装情况、招投标、核准等)。在投研过程中,每一个环节都包含许多关键的高频指标,如何将这些数据和逻辑串联起来并形成一个能够投资的AI,是未来AI厂商可拓展和思考的方向,而这一领域的价值毋庸置疑。文构财经文构财经基于多年积累的数据的先发壁垒,其数据范围覆盖中国沪深、中国香港、美国、新加坡、英国等证券交易所,近20年的海量财经数据,清洗出共计近500G的中英文财经语料(目前数据状态为均已清洗、标定、学习后)。通过AI理解能力与应用场景的深度结合,文构财经为用户提供了基于财经文本的全新深度处理后的数据、指标、分析师报告,从而为学术研究、量化投资、经济监管等提供多方位支持。△文构财经数据库,企业供图 AI+金融:挑战与展望 • 关于挑战 • 未来,随着AI技术在金融领域的更深入发展,更加迫切地需要人才端与业务端的深度结合,以应对日益增长的合规要求。这种深度结合不仅涉及了专业技术的应用,还涉及了跨学科的整合,以及对市场的敏锐洞察。飞笛科技的丘慧慧表示,在未来的金融领域,人工智能预计将迎来更加广阔的发展空间。然而,这种发展也面临着一定的挑战。其中一个关键的挑战是金融机构自身的组织结构。金融机构能否以用户为中心进行组织架构的调整,是决定企业能否成功进行结构转型的关键因素,而跨界人才的挑战是企业所面临的重要挑战。有连云认为,金融领域,对于不同业务场景的理解需要长期积累经验。金融业务有复杂性和专业度,不是简单能驾驭。有连云系统能够实现高效的AIGC生成,这是通用大模型难以完成的任务,而打造具有较高黏性的产品,需要有足够的业务Know-how,并懂得如何进一步优化客户的使用体验。深擎科技表示,AI在金融领域的挑战主要在于B2B领域的商业化实施过程,金融行业分支机构和总部的数字化协作难以有效打通这个矛盾。作为一家创业公司,面临着与客户个性化、定制化需求及标准化产品之间的冲突。深擎科技柴志伟认为,还是要在产品理解上超越客户,充分把握客户的需求和特性,以便为客户打造价值产品。此外,公司还需要积累大量的行业案例和实践经验,以更好地指导和支持客户需求和发展。轻咨询是一种值得采用的服务模式,它可以通过团队在早期与客户的沟通和交流,影响客户的规划和预期,帮助客户将想法收敛到一个可以标准化实施的解决方案,从而实现客户需求的合理满足,以及双方共赢的局面。在人才与技术挑战方面,熵简科技费斌杰认为,AI科技的发展,其核心仍是技术层面的探讨。技术问题并非一蹴而就,它需要深厚的专业积累。倘若把AI视作一个黑盒,训练的关键在于持续优化这个建模过程,如果技术人员未曾尝试过此类操作,那么相关的经验积累无疑将是一片空白,即使能了解大致的操作流程,但要想深入理解这类技术性的经验,仅仅通过理论学习是不够的。这也是在第一线亲自操作和实践的重要性。例如,技术人员至少需要亲自调优过GPT模型。然而在全球范围内,这样经验丰富的专业人士实际上是稀缺的,不仅仅在国内,在海外也同样如此。  • 关于模型的迭代 •  从一个中立的角度对金融领域中各类模型进行比较,就现有技术而言,如GPT、BloombergGPT、FinBert等,各模型间存在着一定的差异。在实际金融领域的应用中,随着参数量及数据集、数据类型及权重、所应用的垂直任务不同,模型的效果也不同(Nan, etc., 2023;...
AI金融:未来已来,金融行业迎来新变革
AI金融助手

AI金融:未来已来,金融行业迎来新变革

李开复老师在《人工智能》一书中指出,智慧金融是AI目前最具潜力的应用领域。金融机构积累了大量数据,并早已开启自动化系统和数据标注等基础设施建设,这为AI应用提供了良好的基础。金融科技正在改变传统银行的运营方式,金融科技创新者的竞争也日益激烈。尽管AI技术仍处于不断发展阶段,但在金融行业的应用前景广阔。
2020金融科技行业:逆势而上的中国公司
AI金融助手

2020金融科技行业:逆势而上的中国公司

本文介绍了2020年上半年英国金融科技行业的统计数据以及国内金融科技行业的发展情况。结果显示,尽管新冠疫情给投资带来不确定性,但在国内金融科技的一些细分行业中,反而呈现出“逆势而上”的趋势。数美科技、亲家数科和明略科技等公司都在各自领域取得了显著的成就,显示了金融科技行业的韧性和发展潜力。
《后疫情时代金融业务数字化转型之道:大模型与小样本数据的应用》
AI金融助手

《后疫情时代金融业务数字化转型之道:大模型与小样本数据的应用》

在后疫情时代,现实世界企业正面临复杂、非线性的变化,数字化、自动化成为提高战略竞争力的关键因素。针对这一情况,天壤联合创始人韩定一在「量子位·视点」直播中分享了他的从业经验和观点。金融机构应用AI一方面是为了合规,另一方面是用机器代替了人工识别,提升了效率并降低了人为因素可能导致的错误率。AI技术已经可以几乎代替人工自动化地去完成单个的步骤和复杂的流程操作。金融机构面临的特殊需求包括严格监管和数据私有化导致的获取成本高,以及少量数据样本训练的AI模型是否能达到高准确率去解决问题。韩定一认为,“大模型 小数据”是最典型的场景,其能让模型生产变成流水线。此外,AI的发展还处于初期阶段,尽管已经取得了显著的进步,但仍有很大的发展空间。
金融科技路线图:从互联网金融到AI金融
AI金融助手

金融科技路线图:从互联网金融到AI金融

本文探讨了金融科技从互联网金融到人工智能的应用和发展趋势。随着技术的不断跃迁和竞技者的升级,监管机构也在密切关注行业的进展。目前,人工智能在金融领域的应用仍处于初级阶段,但 already有所表现。
6位顶尖专家,重新定义AI金融的6种未来丨CCF-GAIR 2019
AI金融助手

6位顶尖专家,重新定义AI金融的6种未来丨CCF-GAIR 2019

▲点击上方 雷锋网 关注 CCF-GAIR 2019 AI金融论坛全回顾。  文 | 王艺  编者按:7月12日-7月14日,2019第四届全球人工智能与机器人峰会(CCF-GAIR 2019)于深圳正式召开。峰会由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办,深圳市人工智能与机器人研究院协办,得到了深圳市政府的大力指导,是国内人工智能和机器人学术界、工业界及投资界三大领域的顶级交流博览盛会,旨在打造国内人工智能领域极具实力的跨界交流合作平台。 大会第二天上午,在聚焦金融行业AI技术应用的「AI金融」专场,六位顶尖AI金融技术与产品专家齐聚,为与会者带来了一场别开生面的主题论坛。 微众银行杨强:用联邦学习解决数据隐私难题 香港科技大学讲席教授、微众银行首席AI官、IJCAI理事会主席杨强教授作为主会演讲嘉宾及AI金融专场开场嘉宾。在AI金融专场,杨强教授为与会者带来题为《联邦学习的最新发展及应用》主题演讲。 演讲开始,他先介绍了微众银行两年来所取得的成就。杨强教授表示,微众银行在金融业务的各个环节均已实现自动化。从贷前业务咨询环节的企业画像,到贷中身份核实、资料审核,再到放款操作环节。此外,微众银行在一些辅助环节,如智能客服、录音质检等也在应用智能自动化技术。目前,微众银行98%的客户问题由智能客服机器人解答,其系统能够进行多轮对话并进行情感分析。 有趣的是,在小微企业贷款方面,微众银行不仅做线上自动化,还做线下自动化。为了解决线下企业风险核查耗时耗力的问题,微众开发了一款线下核验头盔机器人。申请人只需佩戴该头盔设备周游工作场地,即可自动识别风险。 与此同时,杨强教授也强调,在小微企业信贷过程中,出现了一些挑战,业界需要寻求新的解决方案。 第一,如何对抗干扰信号。以金融领域为例,当申请人对面部信息作假时,如何应对?第二,如何在只有小数据的领域应用深度学习。 杨强教授谈到,往往高质量、有标签的数据都是小数据,且不能随着时间的推移进行累积,因为每个阶段的数据和上个阶段都呈现不同的分布,甚至特征都不尽相同。这一问题在金融、医疗、法律场景非常常见。这就意味着,要解决这一问题,需要多方数据打通,联合建模。 但这其中又遇到了问题,那就是数据的隐私保护。2018年,欧盟提出史上最严数据保护法GDPR,足见数据隐私在人工智能发展道路上的重要性。在这样的大环境下,合并数据变得异常困难。 为应对这一问题,杨强教授倡导「联邦学习」(Federated Learning),他以人们合作创作作品为例进行了解释。在两个人或多个人共同写书的过程中,合作者的大脑并非物理地连结在一起,人们用语言交流,传递参数。在这一过程中,人类是有能力保护大脑中的隐私的。 联邦学习参与各方先用本地数据建立模型,再将这个模型的关键参数加密,得到一个即使传到云端也无法解密的包。千万个包用算法加以聚合,得到高精度的模型,再将该模型下传,供个体使用。整个过程中Server、云端均接触不到包内的实际内容。 杨强教授表示,联邦学习技术已经在微众银行得以应用。微众银行的合作企业中包含互联网企业、车企、保险企业等。这些合作方拥有用户大量的不同维度行为信息。应用联邦学习,微众银行能够与合作方联手,针对同一批用户在不交换数据的前提下进行建模。实践证实,AUC指标得以提升,不良率大为下降。 此外,杨强教授还介绍了联邦学习在城市管理、语音识别等领域的应用。杨强教授表示,联邦学习的发展需要建立生态,共同推进。与此同时,杨强教授也在积极推动相关国际标准与参考框架的建立。 京东数科&ZRobot乔杨:不仅要关注黑,更要服务好白 京东数科生态中心信用管理部总经理&ZRobot CEO乔杨在风控行业已有10余年的经验,他曾长期供职世界500强企业——Discover美国发现金融,兼备技术与金融的跨界实力与中美两国的世界级金融科技视角。 现场,乔杨就「数字科技驱动的信贷反欺诈技术」同与会者进行了探讨。ZRobot成立于2016年10月,旨在利用高维度数据资源,结合数据挖掘技术及模型算法,借助京东数科丰富的实践应用场景,打磨自身技术实力并赋能合作伙伴。目前,ZRobot已与近300家银行、保险、证券、信托、小贷公司、持牌机构、消金以及融资租赁公司展开合作,为客户提供智能风控、智能营销解决方案等各类产品支持。 乔杨现场分享了ZRobot在信贷反欺诈方面进行的尝试与取得的成果。 乔杨表示,随着移动互联网的发展,欺诈分子应用的手段层出不穷,产品类型不断迭代进化。现在欺诈已成为一门生意,欺诈分子和团伙多为非常勤奋且聪明的人。早期的欺诈手段往往是员工腐蚀机构,现在已经发展为潜入机构、自营骗贷等更有手段的欺诈方式。与此同时,金融机构对欺诈的防范往往处于滞后状态,这为反欺诈工作的开展带来了阻碍。 乔杨表示,虽然业内已经有很多成熟的可以利用的机制,比如建立良好的内控合规机制、客户管理体系,但往往无法识别三方欺诈的风险。 要识别三方欺诈,第一步要做好交易对手的身份识别。乔杨介绍,当前一些移动APP可从前端抓取多达200余个用户标签,在此之上进行特征延伸拥有很大的空间。常用的做法包括抓取纬度信息,利用陀螺仪检测设备仰角、滑动轨迹等,同时通过前端SDK进行浅层次的生物识别,已经能够做到在用户体验不受影响且不需要额外硬件支持的情况下进行有效的反欺诈识别。 在中国,欺诈行业的群体作案呈现上升趋势,欺诈团伙已经形成了非常完善的上下游产业链。因此,单单识别个人的欺诈风险是不够的,需要由点及面,通过机器学习及复杂的网络技术对用户及周围群体的关联关系进行判断。ZRobot已经积累大量的前端数据用于数据库关联,具体包括设备关联、地址关联、通信关联等。 乔杨认为「近朱者赤,近墨者黑」,与业界的通常做法不同的是,ZRobot不仅将关联关系用在黑名单节点,在白名单上也有所应用。「我们提出的概念是不仅要关注黑,更要服务好白」,乔杨说。 宜信向江旭:用AI实现「以用户为中心」的财富管理 宜信公司高级副总裁、首席技术官向江旭先生一上台就向在场嘉宾透露了一个好消息,宜信旗下品牌,也是国内首家海外上市金融科技公司——宜人贷目前已完成品牌升级,将线上能力与线下资产结合,定名宜人金科。 宜信成立于2006年,是业内领先的财富管理公司。宜信在支付、网贷、众筹、机器人投顾、智能保险、区块链等前沿领域均有积极布局,并通过业务孵化和产业投资参与全球金融科技创新。 关于宜信在信贷行业地位,向江旭谈到,经过13年的耕耘,宜信已经在业界取得了傲人的成绩。「业内有这样一个说法:一个用户想申请贷款,如果他曾经从宜信拿到过贷款,那么其他机构就不用审核了。」向江旭说。 然而在CCF-GAIR 2019 AI金融专场,向江旭不谈信贷,转而和与会人员聊起了智能化的财富管理。 向江旭表示,中国财富管理规模在6万亿,与美国的9万亿尚有一定差距。中国财富管理线上化渗透率为35%,与之相比,美国为40%。中国拥有50余家财富管理公司,而美国拥有300多家。就财富科技的投资规模而言,中美几乎持平。 总体来看,虽然在财富管理市场中美存在一定差距,但中国的增长率很高,产业投入也更高。这就意味着中国的财富管理潜力更大。2007-2016十年间,中国财富管理市场规模以年化20%的复利增长。2016-2018年增长率保持在12%,可预期的未来几年时间内,增长速度仍将维持在双位数。 财富管理行业的目标客户为可投资产在1000万人民币以上的高净值人群以及可投资产在100万人民币以上的大众富裕阶层。在中国,高净值人群截至今年年底将达到220万,未来几年大众富裕阶层人群很快会达到3000万的规模。 向江旭表示,这两类人群对于智能财富管理均有非常强烈的期待。高净值客群一般而言长期享受私人银行家、理财师、金融顾问服务,但尽管如此,这类人群对线上实时获取股票信息、资产状况、财经资讯、投资理财教育内容仍有迫切需求。对于大众富裕阶层而言,很可能他们人生中的第一款投资理财产品就是在线上购买的,这类人群对线上的理财投资及智能化财富管理有天然的需求。 通过大数据技术,宜信能够了解客户对投资理财、家族传承,对创富、守富、传富的需求,也即财富管理行业的KYC。向江旭介绍,这些数据包括客户的电商购物行为轨迹、线下财富管理讲座活动的参与经历等。获得用户画像后再利用AI技术将客户与产品进行精准匹配。 向江旭认为,以前的财富管理是以产品为中心的,很多理财产品网站相当于一个理财超市,这并不是宜信希望看到的财富管理方式。宜信希望用大数据及人工智能技术将以产品为中心的财富管理过渡到「以用户为中心」的财富管理,真正做到千人千面的资产配置模式。 平安寿险沈剑平:深挖应用场景,让AI赋能寿险各业务线...
蚂蚁能攻下国产金融大模型这个山头吗?
AI金融助手

蚂蚁能攻下国产金融大模型这个山头吗?

6 月 21 日消息,蚂蚁集团的技术研发团队正在自研语言和多模态大模型,内部命名为“贞仪”。蚂蚁集团回应称“消息属实”。 6 月 19 日,由清华大学计算机系教授、人工智能研究院副院长朱军带领的新团队完成了近亿级天使轮融资,由蚂蚁集团领投。据悉,这是ChatGPT火热后,蚂蚁集团第一次下场投资大模型公司,也是朱军在瑞莱智慧后的第二次创业。 朱军教授 早在2019年清华AI研究院基础理论研究中心成立,该中心首席科学家朱军及其团队同期发布了第三代人工智能平台RealAI。RealAI致力于研究和推广可理解的第三代人工智能,同时与金融、工业制造等行业应用深度结合,其中在金融风控领域,当时的RealAI已经可以实现“无监督小样本、端到端的建模方式,减少行业专家工作量的同时,能够提供到可理解的决策依据。” 2021年,蚂蚁集团宣布基于可信AI技术的“端云协同”风控已覆盖99%的业务场景。 不难看出,清华朱军团队和蚂蚁集团的AI技术导向有重合部分,这也是阿里体系明明已经有阿里通义大模型,蚂蚁集团还在投资大模型的出发点。尽管阿里与蚂蚁在资本、管理层面加速分离,但技术方面依然可以共享,因为两者要解决的问题不同。 简单讲,阿里通义大模型面向企业服务,蚂蚁正在研发的大模型面向金融科技fintech,是两个不同的赛道。 蚂蚁在AI领域有何积累?大模型对其业务板块有何助益? 公开资料显示,蚂蚁集团于2015年起投入可信AI技术研究,并于2016年全面启动AI智能风控防御战略。目前已拥有全球范围内数量最多的“AI安全可信关键技术”专利,形成了新一代智能风控体系IMAGE,并已在反欺诈、反洗钱、反盗用、企业联合风控、数据隐私保护等多场景落地。 可信AI技术体系 2018 年,蚂蚁AI首席科学家漆远及其团队,在人工智能模型算法中融入经济学 “博弈理论”,开发了一项业界全新的技术——“智能对抗”,即通过结合 AI 和博弈对抗,让机器自动且实时、动态地对自身系统进行安全性攻击,从而提升模型能力,使得处理结果更加准确。 “未来的风控将不再是人和人的斗争,而是 AI 与 AI 的博弈,”漆远在演讲中表示,“在支付宝上,每天上亿笔交易背后,发起攻击的早已不是散户,而是专业的黑产团伙。” 2020 年,“智能对抗” 技术正式应用于支付宝反欺诈。 支付宝反欺诈技术 实际上,互联网金融风控场景是天然的对抗博弈场,支付宝从未停止过与黑产及黑产背后的AI做斗争。在内容安全、反洗钱、反欺诈等领域中,蚂蚁集团对AI模型决策过程及结果的可解释性要求、对抵御黑产攻击的鲁棒性(Robustness)要求,已经达到了空前的高度。 2021年蚂蚁集团机器智能部总经理顾鸣曾表示,“作为制约AI技术发展的瓶颈,安全和可信性研究无疑将成为未来三十年人工智能技术的关键环节。” 可以说,蚂蚁投资大模型并不是跟风心血来潮,而是内部人工智能研发积累到一定程度,必然会发生的技术跃迁。与处于学术前沿的高校和科学家们合作,将有助于与其保持在人工智能金融科技领域持续保持领先地位。高校也非常认可蚂蚁这个试验田,毕竟每天有无数黑产盯着我们普通老百姓的支付宝钱包。 简单讲 鲁棒性就是指遭受攻击时系统的稳定性 除了金融风控领域,蚂蚁的其他业务板块对大模型的需求也非常旺盛。 蚂蚁涵盖场景与支付、数字金融、科技服务三大业务板块。 1、蚂蚁的支付场景主要围绕支付宝钱包展开,蚂蚁相关投资涵盖网上购物、零售店、游戏、日常缴费、餐饮、汇款、公益、信贷、金融服务、充值、校园服务、交通和医疗服务等,并且已在全球10个地区开发了本地化的电子钱包。 尽管在2017年蚂蚁金服就全面开放AI客服能力,据称比人工客服效率高出30-60倍。但如果有大模型的加持,类GPT模式的支付宝客服可以有效节约成本、提高服务效率、提高客户满意度,更重要的是能沉淀数据分析和反馈。 2、蚂蚁在数字金融领域,蚂蚁在融资信贷、财富管理、银行保险业务中均有布局。驱动这些业务的金融科技底层技术,蚂蚁称之为“BASIC”基础技术,即Blockchain (区块链)、AI(人工智能)、Security(安全)、IoT(物联网)和Cloud computing(云计算),重点关注区块链和分布式技术。 以智能保险的数字金融服务为例。智能保险用在理赔上时,怎么让理赔的效率更精准、更快。大模型技术加持下,未来结合蚂蚁现有的理赔宝金融只是图谱平台和OCR技术,使得理赔更有效率。 3、技术服务领域,大模型将帮助政企实现技术升级。2019年以来,蚂蚁在强化政务业务布局背景下,蚂蚁金服连续布局电子政务和财税信息化领域的多家技术类企业。丰富的底层技术和基础产品,为蚂蚁金服定制化的解决方案提供了充足的弹药。以蚂蚁金服、阿里云与南京银行共同合作的鑫云+互联网金融平台为例,其整合了SOFA中间件、OceanBase数据库、大数据平台、移动互联网平台等多项技术,最终形成分布式的金融解决方案。 蚂蚁金服集团人工智能部总监周俊,在一次技术分享会中提到一个案例。中国农村最大的一个普惠金融机构之一,叫做中和农信。在中国农村很多地区,很多人享受不到金融服务,蚂蚁自己也做过统计,如今全世界的成年人里面还有 50%...
探索中国传统文化的魅力:一生的文化之旅
AI金融助手

探索中国传统文化的魅力:一生的文化之旅

这篇文章主要介绍了如何成为一名优秀的文章写作高手。首先,要明确自己的角色和目标,即以写作为职业并追求卓越。其次,要不断学习和实践写作技巧,包括研究和分析优秀文章、多写多练和反思总结。最后,要保持对写作的热爱和专注,充分发挥自己的才华和创造力,创作出高质量的文章作品。总之,成为一名优秀的文章写作高手需要不断的努力和实践,同时保持对写作的热爱和专注。
《探索未来:人工智能助手的专题推荐之路》
AI金融助手

《探索未来:人工智能助手的专题推荐之路》

这篇文章探讨了如何成为一名优秀的文章写作高手。首先,要明确自己的角色和目标,其次需要不断学习和实践,同时关注细节和语言表达的准确性。最后,要保持对写作的热情和对知识的渴望,才能在文章创作中取得更好的成绩。
刘新海:ChatGPT为金融科技带来八大价值,潜在风险远超监管步伐
AI金融助手

刘新海:ChatGPT为金融科技带来八大价值,潜在风险远超监管步伐

2022年11月,ChatGPT横空出世,戳中了资本、技术、产业的兴奋点。微软市值一夜暴涨5450亿美元,腾讯、百度、360、美团等国内大厂也开始纷纷布局ChatGPT。AI凭借“创作”强势崛起,这预示着AIGC元年已经开启,下一个万亿赛道即将爆发。 中译出版社一直以来密切关注科技类、前沿类、趋势类话题,2023年2月重磅出版关于ChatGPT和AIGC图书——《AIGC:智能创作时代》。 鉴于以上背景,2023年2月24日,由中译出版社主办、零壹智库作为支持机构的“AIGC与智能数字时代前沿论坛暨《AIGC:智能创作时代》新书发布会”在京举办,邀请行业内最权威专家、学者深入探讨火爆的ChatGPT背后的智能数字发展浪潮。 以下是全联并购公会信用管理委员会常务副主任刘新海主旨发言内容。 大家下午好,非常高兴和大家做一个这样的分享,我首先介绍一下个人我的背景背景:在十年前,我一直从事人工智能前沿方面的研究,从计算机视觉到文本挖掘然后做编程、在欧洲获得AI领域的博士学位,和相关科技公司合作并在欧洲工作一段时间。之后的十年,就进入了金融科技领域,在国内央行工作了很多年。目前我负责一个智库,研究征信和数据行业的商业模式与监管政策。同时,我与北大金融智能研究中心的团队合作,坚持做一些AI技术研发方面的创新。 ChatGPT是信息科技在当下的大风口,预示着未来数字经济的发展方向,引起了强烈的关注。金融科技是信息技术变现的重要场景,因为金融具有逐利性,它希望采用最先进的技术来提高业务效率。 ChatGPT对金融科技有三个方面的影响:第一个是ChatGPT对金融科技的直接价值,第二个是ChatGPT在金融科技创新中的潜在风险,第三个是ChatGPT对于金融科技创新的间接价值。 ChatGPT主要有两大技术特点。第一个特点是通用性。通用指它什么问题都可以回答;第二个特点是它处理的是非结构化数据。其实整个社会大部分信息是非结构化数据,而且非结构化数据和我们的实际应用更接近。因此,这是巨大的突破。ChatGPT是一个超级语言模型,而不是视觉模型,也不是听觉模型,当然也不是硬件方面的革命性突破,这是我们需要了解ChatGPT的一些边界,因为ChatGPT不是万能的。 这次ChatGPT现象是在当前信息技术与硬件技术进步共同推动下的大突破。与十年前的信息不同,在大数据时代,人类社会大部分的信息都在互联网上,越来越全面,它们都可以被采集、分析、学习和应用,这是ChatGPT获得成功的一个前提。算力的进步也是推动ChatGPT成功的重要动力。ChatGPT也用了很多人工标注和反馈,以及很多先进的人工智能机器学习方法,例如强化学习。 但是值得一提的是,ChatGPT虽然是大语言模型,但是它在自然语言处理NLP技术上从过去到现在一直没有大的突破,因为人的语义、语法和句法非常复杂,不是很容易解决。但是ChatGPT绕开了这个瓶颈,它通过人工反馈和大数据的训练学习逼近来解决。 (一)ChatGPT在金融科技领域的直接应用价值 主要有五个方面的直接价值。 ChatGTP作为大语言模型,第一个最重要的应用方向就是智能客服这个领域,因为在金融领域有许多个细分的条线都需要有智能客服和虚拟助手,从投资、信贷、信用卡到个人理财等,每一条线都需要智能客服。我们曾经想做征信领域智能客服系统,但是一直存在技术壁垒。对于个人信用报告,因为涉及每个人的个人利益,所以有很多异议和咨询的需求。如果做一个这种问答系统自动解答在征信领域的问题,这在过去非常难,但是现在由于ChatGPT技术,是可以实现的。当然这种智能客服需要垂直领域的专家知识相结合。 第二个重要的方向是数据分析。由于金融领域有大量的预测分析工作,金融本身可以视为一个数据行业或信息处理行业,有着大量的预测分析工作需求,很多是一些固定模式的预测分析,这部分可以使用ChatGPT。它有非常好的特点——能处理非结构化的信息,可以针对更多的数据处理,而传统的预测方法依赖于结构化数据分析。 第三个方向是欺诈检测。有一些欺诈的模式是固定的,ChatGPT可以被用来检测这些欺诈模式。 第四个方向是财务规划。ChatGPT可以利用金融主体的信息和以往的知识,提供更加个性化的定制服务。 第五个方面是风险管理。风险管理也是我们金融领域非常重要的内容。金融行业存在大量的风险模式,很多风险管理过程也是流程化的,ChatGPT可以有效地提供风险管理的咨询和设计。 需要强调的是这几个方面的应用都需要专家参与,都需要以应用模式非常清晰、流程标准化为前提。不是说ChatGPT一装上什么问题都解决,而是需要专家将这个模式分析清楚,再借助ChatGPT的这种巨大的分析和学习能力来解决。 (二)ChatGPT在金融科技创新中的潜在风险 目前很多法律专家和技术伦理专家都在讨论ChatGPT在金融科技方面的应用上会带来很多风险。 首先,金融的封闭性增加了机器学习的难度。金融行业的数据和业务都非常封闭,ChatGPT很难学得到,如果学不到,何谈解决这些领域相关的问题? 其次,金融领域还涉及消费者重大利益。金融交易并不是简单地买个小东西,个人房贷往往涉及金额上百万,而企业的借贷甚至达到几千万。因此,金融交易的公平性、可解释性都非常重要。如果利用ChatGPT来进行风险管理和决策,这些基本权益如何来保证?2023年2月23日的《华尔街日报》报道摩根大通这家银行开始限制员工使用ChatGPT,因为不知道答案是否准确及大家是怎么使用的。如果任何地方都用ChatGPT就会出现问题,因为金融还是要保证决策分析的准确性、透明性和公平性。 AI的应用将会涉及人类社会的所有领域,特别是软件领域。怎样让AI应用能够被社会大众所信任是一个基本的问题。如果ChatGPT的网络安全风险和知识产权的风险都能够得到很好的解决,大众就会放心地使用。 当然像ChatGPT这股浪潮远远超出我们监管的步伐,同时监管也要和创新进行平衡。那怎么来面对ChatGPT所带来的诸多风险呢? 这就需要倡导AI行业应用的科技伦理。从道德层面上,作为ChatGPT的使用者,我们个人和机构都要主动采用负责任的AI标准,促进社会和谐。同时要有专家的声音和多方博弈,这样更好地促进对监管合规性的跟进和对AI伦理的倡导。 (三)ChatGPT的间接价值 这个方面也很重要。ChatGPT最大的一个意义就是给我们带来了新的思维方法,同时也激发出大家创业创新的激情。现在国内很多互联网企业都在跟进这个方向上的发展就是一个很好的趋势。ChatGPT会带来思维方式的改变,它会渗透各个领域。每个领域都需要想一想AI能帮助其解决什么问题,哪些是它解决不了的,以及它会带来什么问题。 ChatGPT可以给金融科技的创新带来以下几点启发。 第一,借助小模型解决金融垂直领域问题。ChatGPT是大模型可以解决通用问题,但是对于金融垂直领域的问题可以用一些小模型解决,比如个人征信咨询问答系统。用小模型更聚焦,效果会更好一些。 第二,借助AI工程的便利解决传统模型问题。ChatGPT通过AI工程思路,借助目前的算力和大数据优势,绕开传统NLP模型技术上面的一些瓶颈。对于金融科技领域的传统疑难问题,我们也可以采取同样的工程思路来尝试解决一些非常棘手的问题。 第三,利用AI助力金融科技的学习、教育、培训和科研。ChatGPT目前可以通过收集资料、分析知识分析帮助我们学习,辅助我们做研究。未来利用AI辅助金融科技——这个前沿和交叉领域的学习和研究,会有很大空间。 最后强调两点: 第一,目前关于ChatGPT和AI的使用仍需要专家的参与,特别是如果有优秀的专家参与,它的成功可能性会更大一点,因为专家能更好地把握它的流程、模式和准确性。 第二,ChatGPT功能非常强大,会给我们的生活和工作带来巨大的帮助。我们有左脑、右脑,ChatGPT有可能会是我们的第三个脑。左脑和右脑可以用来思考、逻辑推理和释放感情,而ChatGPT可以作为我们第三个脑进行信息的收集、信息的处理、数据的分析。 End. 零壹读书会第3期丨《美国征信史》 ↑↑↑扫描二维码购买零壹智库最新书籍 《隐私计算:数字经济新基建》 《2023零壹智库全年会议规划》 来个“分享、点赞、在看、设为星标”?