国雄资本董事长姚尚坤:拥抱AI变革,助推沪港企业金融数字化转型
AI金融助手

国雄资本董事长姚尚坤:拥抱AI变革,助推沪港企业金融数字化转型

原标题:国雄资本董事长姚尚坤:拥抱AI变革,助推沪港企业金融数字化转型 深圳商报·读创客户端记者 涂竞玉 “在数字化时代,应积极拥抱技术变革,AI在金融科技领域将有重要作用。”日前,国雄资本董事长姚尚坤在沪港企业家圆桌会上表示,国雄资本将为沪港企业提供全周期金融服务。 “过去五年,国雄资本经历了电子化、信息化到数字化的升级。”姚尚坤强调,数字化时代需在观念上转变,从数字原生角度优化金融科技为银行等金融机构服务。技术进步催生新公司与业态,拥抱变革的企业方能在时代浪潮中立足。 姚尚坤对AI大模型话题感触深刻,看好AI赋能金融科技的前景。他指出,在银行业,许多岗位如客服、理财师等处理非结构化数据,传统AI技术难以应对,但AI大模型为这些问题提供了解决方案。他强调,未来要战略上全面投入AI,行动上则将AI技术应用于各个领域。 姚尚坤表示,AI大模型技术将改变人力密集行业如银行和保险等的运营模式,AI助手有望普及至每个岗位,解决问题,他对此充满期待。“AI革命和新能源发展是大势所趋,但投资需谨慎。在这样的多变环境中,蕴藏着巨大的投资机遇,修炼投资‘理性’、减少情绪干扰是穿越迷雾的关键。”返回搜狐,查看更多 责任编辑:
2024中关村论坛年会|金融业的AI革命:创新动力与安全挑战
AI金融助手

2024中关村论坛年会|金融业的AI革命:创新动力与安全挑战

原标题:2024中关村论坛年会|金融业的AI革命:创新动力与安全挑战 金融是“AI+”的最理想应用场景,而AI是普惠金融的核心驱动力之一。4月29日,在2024中关村论坛年会——金融科技平行论坛上,国家金融监督管理总局政策研究司司长李明肖表示,要高度重视人工智能技术应用过程中数据安全和消费者隐私保护问题。 中国人民银行此前印发的《金融科技发展规划(2022—2025年)》中明确提出,要抓住全球人工智能发展新机遇,以人为本全面推进智能技术在金融领域的深化应用。在多位与会嘉宾看来,人工智能的蓬勃发展为金融业带来了无限可能,数据要素在其中发挥着至关重要的作用。但与此同时,“牢牢守住不发生系统性金融风险的底线”仍是关键词,行业呼唤对数据安全更严格的保护与要求。 AI的金融渗透力 “根据最近一项市场研究,人工智能已应用于香港金融业多个领域,其中聊天机器人和辨识认证是应用程度最高的领域。研究也指出,人工智能的进一步应用将为企业带来大量机遇,特别是在算法交易及自动化客户服务等应用范畴。”会上,香港特别行政区财经事务及库务局局长许正宇说道。 人工智能与金融相遇,为金融科技领域发展带来了创新和变革的可能。值得注意的是,金融业的数字化基础好、应用场景密集,也为人工智能应用提供了广阔空间,是“人工智能+”落地的重点行业之一。 李明肖表示,当前,人工智能在智能客服、工程评估、信贷审批等数字金融领域已经有了一些应用,提高了金融服务的个性化和智能化水平。数字金融的发展为人工智能技术的创新和应用提供了丰富的产品和技术资源。同时,监管部门利用人工智能技术,能够更好地识别风险,识别股东股权关联关系及资金往来,有效提高监管效率。 许正宇进一步指出,在现今信息化的时代,金融业面对大量数据和复杂的市场环境。人工智能具有强大的数据处理和分析能力,能够从庞大的数据库中挖掘出具有价值的信息,协助金融机构更好地理解市场趋势和客户需求,提供准确的预测和决策支持,同时有助于提高金融交易的效率和速度,为金融创新开拓新的可能性。 此外,人工智能可应对金融业人手短缺的问题,将相对简单的工作自动化,以腾出人力资源集中处理复杂的增值工作,包括监督、系统开发和品质保证,有助于金融机构提升生产力和效率。 网商银行副行长江浩以公司业务为例,他表示,作为一家互联网银行,AI永远是网商银行探索的一个重要领域。最初,网商银行的AI应用重点在客户服务,面对每天百万级的线上客群做融资;第二阶段,将AI用于辅助风控。而到如今,AI能力进一步升级,帮助客户挖掘价值。例如,一些小微客户对金融常识没有概念,当线下面对客户经理时,并不知道该提供什么。网商银行提供的AI解决方案使小微融资过程变得简单,客户只要把租赁合同、店面照片等有价值的所有东西都拍下来并上传,剩下的都可以交给AI。 对人工智能的重视,已成为了一种产业趋势。2023年以来,生成式AI、大模型产品爆发式涌现,并被金融机构广泛运用于智能客服、智能营销甚至风控领域。有统计显示,2023年生成式人工智能的私人投资金额达250亿美元,比前年增长9倍。 基础建设方面,北京推进国家新一代人工智能创新发展试验区和国家人工智能创新应用先导区建设,打造具有全球影响力的人工智能创新策源地,积极拓展人工智能在智能客服、智能贷款审批、信用贷款等金融领域应用场景,健全应用场景发布机制,促进供需研发应用服务技术的双向赋能,并利用“冒烟指数”等工具加强监管,实现风险“四早”管理。海淀区正在打造全球AI创新策源地和产业高地,建立科技企业与金融机构的常态化对接机制,支持数字金融创新。 安全与合规难题 而与此同时,一些挑战仍然存在。“安全”与“合规”是金融业绕不开的话题。人工智能加速金融与科技深度融合的同时,对于数据要素的保护和应用成为制约金融机构高质量发展的重要因素。 许正宇直言,金融机构应用人工智能时或会涉及大量数据,其中包括个人和敏感资料。此外,数据的准确性及人为监督对人工智能的运作至关重要。 在交银金融科技有限公司副总裁王浩看来,金融机构利用数据要素提升实体经济服务水平,带来了新平台、新视野、新连接、新模式。一方面,随着各类数据的融合深入,这些要素形态不断发生变化,新技术驱动的场景、平台不断出现,从而提升了金融机构服务效率。 王浩指出,另一方面,各类商务平台、流量平台、自媒体平台层出不穷,企业也在进行数字化转型,从而衍生出各类的数据要求。如何将金融服务融入这些新的平台、新的业态,只有通过数据要素之间的连接,运用隐私计算等技术打通不同主体之间的流程和数据壁垒,才能为广大客户提供更加有效的服务。 “未来,谁能更好地掌握数据要素,谁就能掌握金融发展的制高点。”有业内人士这样认为。第四范式(北京)技术有限公司联合创始人兼总裁胡时伟同样表示,数据要素给金融业带来的价值,一是释放,二是升级。当前,大模型在金融业不能有效落地并提供服务,问题在于愿景不清晰、路径不明确、分配不合理。有效解决这样的发展挚肘,需要从数据中寻找答案。 大模型新路径探讨 不可否认的是,人工智能等数字技术的迭代速度快,在蓬勃发展机遇中也蕴含了一定的偏差空间。因此,如何平衡人工智能带来的业务效率提升与用户数据安全的问题,尤其值得金融机构警惕。 对此,许正宇强调,金融机构必须采取稳妥的网络安全措施,例如全面加密个人和敏感资料、定期进行保安审查,以及建立注重数据安全的机构文化。在应用人工智能时,金融机构必须尊重个人资料隐私,以及严格遵守所有适用的个人资料隐私及保护知识产权的相关法律。 中国国际金融股份有限公司专精特新企业服务业务执行负责人黄弋进一步提出,对于隐私的保护是“极容易出问题的”,因此,更需要在规则的前置层面上以及技术底层上就加以逻辑上的区分和管理。 胡时伟则提供了一条新的路径。当前,大语言模型对C端处在“不敢用”的状态,究其原因,是大语言模型“直通”外界带来的注入风险与加装额外保护造成的成本提升的矛盾。如果换一种思路,不是选择把所有的敏感数据都“一股脑”塞进去,而是清晰地知道构建怎样的智能、用的什么数据以及服务产品对外的核心价值,选择把原始的数据转化为知识、转化成经验,即数据服务化,从某种意义上来讲是解决安全问题的一个很重要的方式。 除了对数据与隐私的把控,另一些安全问题或成为人工智能助力金融路上的“绊脚石”。许正宇举例到,金融机构可能需要第三方服务供应商提供人工智能所需的技术和基础设施。由于市场上的人工智能服务供应商较为集中,如有突发情况导致服务中断或故障,便会影响金融机构的营运。因此,金融机构必须制定全面的应变计划,以确保金融系统畅顺运作。 此外,人工智能模型可以按指示撰写流畅而且高质量的分析,也可以理解图像、处理声音及创作视频。然而,人工智能模型也存在幻觉风险,有机会输出看似符合逻辑但不合乎事实的错误资料。许正宇对此表示,金融机构及从业人员不能完全倚赖人工智能,人工智能也不能取代金融专业人员的独立思考和判断。 北京商报记者岳品瑜董晗萱返回搜狐,查看更多 责任编辑:
专访中关村互联网金融研究院院长刘勇:生成式AI是金融科技的下一个风口
AI金融助手

专访中关村互联网金融研究院院长刘勇:生成式AI是金融科技的下一个风口

原标题:专访中关村互联网金融研究院院长刘勇:生成式AI是金融科技的下一个风口 每经记者:袁园每经编辑:马子卿 4月25日至29日,2024中关村论坛年会在北京举行。本届论坛以“创新:建设更加美好的世界”为主题,上百位顶尖专家、上千名演讲嘉宾将围绕科技创新引领社会进步、民生改善、可持续发展等议题,共话开放创新,共谋发展机遇,为建设更加美好的世界贡献智慧和力量。 据悉,本届论坛设置了论坛会议、技术交易、成果发布、前沿大赛、配套活动5大板块,将举办近120场活动,100多个国家和地区、150余家外国政府部门和国际组织机构等受邀参会。 中关村互联网金融研究院院长 刘勇 图片来源:每经记者 袁园 摄 在4月29日举行的金融科技论坛上,《每日经济新闻》记者(以下简称NBD)专访到中关村互联网金融研究院院长刘勇,其就科技对金融流程和效率的改变以及未来生成式AI在金融领域的发展前景给出了解答。 科技和金融联合推动了经济社会进步和发展 NBD:从最初的触网到数字化、再到现在的金融科技,金融行业对于科技的投入和重视越来越高,金融科技在机构的探索和实践中,不断地在迭代和发展。请问您如何看待科技在金融业务中扮演的角色?科技对金融业务的效率、流程等带来了哪些颠覆式的改变? 刘勇:科技在很大程度上为金融要素向创新聚集、改善金融要素的资源配置效率提供可能。科技与金融犹如车之两轮,共同驱动经济社会进步与发展。科技与金融的有效结合,金融要素供给可以在更高水平上与科技创新的内在需求实现动态平衡,金融“脱实向虚”的现象得到有效缓解,金融服务实体经济的成效更加显著,科技创新主体的融资更加多元化、便利化和高效化。以支持创新融资为目的的金融产品和服务更加丰富,金融对创新的支撑作用更加明显。 首先,科技显著提升金融业务效率。通过大数据、人工智能等技术,金融机构大幅缩短传统金融业务办理时间。自动化工作流程减少了人工干预,降低了错误率,同时增强了全天候服务能力,使金融服务不受地理限制和营业时间约束。 其次,科技加强金融业务风险管理与合规。大数据分析与人工智能技术赋予金融机构风险识别与防控能力。通过实时监测海量数据,金融机构能够精准评估客户信用、识别欺诈行为、预测市场动态,做出更准确的风险定价和信贷决策。同时,AI辅助的反洗钱系统能够高效筛查异常交易,增强合规监控。监管科技(RegTech)则助力金融机构满足日益严格的监管要求,自动报告、审计和合规检查,降低违规风险。 此外,科技优化客户服务体验。移动银行、在线交易平台、虚拟助理等数字化工具使得客户能够在任何时间、任何地点便捷地进行账户管理、投资交易、咨询查询等活动。个性化推荐、智能客服聊天机器人提供“7×24小时”无缝服务,增强了客户满意度。此外,开放银行API接口使得第三方开发者能够创建集成多种金融服务的应用,进一步丰富了金融生态系统,满足消费者多元化需求。 NBD:如果让您给金融科技的发展来定义,您认为哪些技术、事件是金融科技发展的关键节点? 刘勇:金融科技(FinTech)的发展是一个持续演进的过程,其中技术进步与金融业务深度融合,创造出新的产品、服务、模式和基础设施,以提高金融服务的效率、安全性、可获得性和客户体验。 大数据与数据分析技术、人工智能技术极大地推动了金融科技快速发展。其中,大数据技术使得金融机构能够收集、整合、分析海量的内外部数据,用于风险评估、信用评级、市场营销、反欺诈等领域,极大地提升了决策的精准度和效率。人工智能技术被广泛应用于智能投顾、智能客服、自动化风控、智能信贷审批、反洗钱监测等,极大地提升了金融服务的智能化程度。 2018年,北京市发布《北京市促进金融科技发展规划(2018年—2022年)》,加速打造具有全球影响力的金融科技创新中心;2019年,中国人民银行印发《金融科技(FinTech)发展规划(2019—2021年)》,这是我国首份金融科技规划,建立健全我国金融科技发展的“四梁八柱”,有力推动了金融科技良性有序发展;2022年,中国人民银行编制第二轮《金融科技发展规划(2022—2025年)》,标志着我国金融科技行业从“立柱架梁”全面迈入“积厚成势”新阶段,将推动金融科技治理体系的不断完善,促进金融与科技更深度融合、更持续发展。 此外,还有一个关键事件点也加速了金融科技的发展。2020年,在全球新冠肺炎疫情的背景下,无接触金融服务如远程开户、线上贷款和视频客服等需求迅速增长。同时,数字货币(例如,央行推进数字人民币试点工作)、开放银行、监管科技、AI金融和隐私计算等前沿领域也迎来了快速发展,金融科技正深度渗透至金融行业的各个环节,展现出其在现代金融体系中不可或缺的作用。 生成式AI能更好地理解客户需求,提供个性化的金融产品和服务 NBD:随着生成式AI的流行,很多金融机构开始将生成式AI应用在实际业务中。据您所知,生成式AI技术应用在金融领域时,存在着哪些难点和风险? 刘勇:生成式AI在金融领域的应用确实带来了许多机遇,但同时也伴随着一些挑战和风险。 首先,数据安全和隐私保护是一大挑战。金融机构拥有大量的用户数据,如何在利用生成式AI进行数据处理和分析的同时,确保数据的安全、用户隐私保护,是必须重视的问题。 其次,模型的准确性和可靠性也是关键。生成式AI的预测和决策能力直接影响到金融业务的运行效果。如果模型存在偏差或错误,可能会导致金融风险的增加,甚至引发严重的经济损失。因此,金融机构在应用生成式AI时,需要确保模型的准确性和可靠性,并进行持续的监控和优化。 此外,监管和合规问题也是不可忽视的难点。随着生成式AI在金融领域的应用越来越广泛,相关的监管政策和法规也在不断完善。金融机构需要按监管的要求,确保业务合规,避免因违规操作而面临风险。 NBD:您认为生成式AI会成为金融科技的下一个风口吗?其会对金融行业带来哪些新的变化? 刘勇:我认为生成式AI是金融科技的下一个风口。随着技术的不断进步和应用的不断深化,生成式AI将成为下一轮金融行业创新的核心驱动力。 首先,生成式AI将提升金融服务的智能化水平。通过运用自然语言处理、图像识别等技术,生成式AI可以更好地理解客户需求,提供个性化的金融产品和服务,例如定制化的投资建议和金融产品推荐等。这将使金融服务更加便捷、高效,提升客户体验。 其次,生成式AI将有助于降低金融风险,可以帮助金融机构更有效地进行风险管理和市场预测。通过对大量数据的分析和挖掘,生成式AI可以帮助金融机构更好地识别和评估风险,提供有效的风险管理措施。这将有助于降低金融机构的风险水平,提高业务稳定性。 此外,生成式AI还将推动金融行业的创新和发展。通过结合其他新兴技术,如区块链、大数据等,生成式AI将为金融行业带来更多的创新应用和业务模式。这将有助于提高金融机构的运营效率、降低成本,并通过自动化流程简化决策过程,推动金融行业的转型升级,提升整体竞争力。 总之,生成式AI在金融领域的应用前景广阔,将为金融行业带来诸多新的变化和机遇。当然,我们也需要关注并解决其存在的难点和风险,确保技术的健康发展。 每日经济新闻返回搜狐,查看更多 责任编辑:
金融圈注意了!彭博研究人员刚推出BloombergGPT
AI金融助手

金融圈注意了!彭博研究人员刚推出BloombergGPT

ChatGPT引爆的AI热潮也“烧到了”金融圈,彭博社重磅发布为金融界打造的大型语言模型(LLM)——BloombergGPT。 3月30日,根据彭博社发布的研究报告显示,其构建了迄今为止最大的特定领域数据集,并训练了专门用于金融领域的LLM,开发了拥有500亿参数的语言模型——BloombergGPT。 该模型依托彭博社的大量金融数据源,构建了一个3630亿个标签的数据集,支持金融行业内的各类任务,在执行金融任务上的表现远超过现有模型,在通用场景上的表现与现有模型也能一较高下。 BloombergGPT到底有多强 根据彭博发布的报告来看BloombergGPT对金融行业来说无疑是一次颠覆性创新。 我们先来看一下BloombergGPT使用到的庞大数据集。 研究人员利用彭博社现有的数据,对资源进行创建、收集和整理,构建了迄今为止最大的特定领域数据集,并创建了一个拥有超过7000亿个标签的大型训练语料库: 彭博作为金融数据公司,数据分析师在公司成立的四十年间收集了大量的金融材料,拥有丰富的金融数据档案,涵盖了一系列的主题。 我们将这些数据添加到公共数据集中,创建了一个拥有超过7000亿个标签的大型训练语料库。 BloombergGPT的训练数据库名为FINPILE,由一系列英文金融信息组成,包括新闻、文件、新闻稿、网络爬取的金融文件以及提取到的社交媒体消息。 为了提高数据质量,FINPILE数据集也使用了公共数据集,例如The Pile、C4和Wikipedia。FINPILE的训练数据集中约一半是特定领域的文本,一半是通用文本。为了提高数据质量,每个数据集都进行了去重处理。 利用庞大的数据集,并基于通用和金融业务的场景进行混合模型训练,BloombergGPT诞生了。 一般来说,在NLP领域,参数数量和复杂程度之间具有正相关性,GPT-3.5模型的参数量为2000亿,GPT-3的参数量为1750亿。 根据BloombergGPT的训练结果显示,其在执行金融任务上的表现远超过现有的模型,且在通用场景上的表现与现有模型也能一较高下。 BloombergGPT优势:不可替代性和准确性 当下,通用NPL模型也可以处理金融领域的任务,那为金融圈“量身定制”的模型究竟有何意义? 彭博认为,针对特定领域模型有其不可替代性且彭博的数据来源可靠: 因彭博社的大多数应用均为金融领域,着手构建了一个针对金融领域的模型具有优势。 除了构建金融领域的LLM外,本文的经验也为其他研究专用模型提供了参考。我们的方法是在特定领域和一般数据源上训练LLM,以开发在特定领域和通用领域上均表现优异的模型。 此外,我们的训练数据不同于传统的网络爬取数据,网络上的数据总有重复和错误,但我们的数据来源可靠。 而更重要的是,报告指出,通用NLP模型处理金融领域任务时会面临不少挑战,首先就是无法理解财经新闻背后的市场“情绪”: 以情感分析为例,一个题为“某公司将裁员1万人”,在一般意义上表达了负面情绪,但从金融市场情绪来看,它有时可能被认为是积极的,因为这一做法可能提振投资者信心,使公司的股价上涨。 从测试来看,BloombergGPT在五项任务中有四项(ConvFinQA,FiQA SA,FPB和Headline)表现最佳,NER(Named Entity Recognition)排名第二: 测试一:ConvFinQA数据集是一个针对金融领域的问答数据集,包括从新闻文章中提取出的问题和答案,旨在测试模型对金融领域相关问题的理解和推理能力。 测试二:FiQA SA,第二个情感分析任务,测试英语金融新闻和社交媒体标题中的情感走向。 测试三:FPB,金融短语库数据集包括来自金融新闻的句子情绪分类任务。 测试四:标题,数据集包括关于黄金商品领域的英文新闻标题,来判断新闻标题是否包含特定信息,例如价格上涨或价格下跌等。 测试五:NER,命名实体识别任务,针对从提交给SEC的金融协议中收集金融数据,进行信用风险评估。 对于ConvFinQA来说,这个差距尤为显著,因为它需要使用对话式输入来对表格进行推理并生成答案,具有一定挑战性。 (注:GPT-NeoX为OpenAI GPT-3的一个开源替代品) BloombergGPT将助力新闻领域 既然BloombergGPT测试中的表现如此优异,那未来可以怎么用? 除了金融数据查询、回答金融相关问题,BloombergGPT未来可以被新闻领域广泛使用: BloombergGPT训练是以众多新闻为基础的,因此它未来将协助记者日常工作。 记者需要为每个部分编写简短的标题,专门为此任务设计的模型维护成本太高,但BloombergGPT在这个方面表现优异。 可以利用BloombergGPT更好的查询金融相关的知识。 如,BloombergGPT能够很好地辨别公司的CEO。(虽然BloombergGPT正确地识别了CEO,GPT-NeoX出现了错误,FLAN-T5-XXL则完全未能识别)。 对于这个或将颠覆金融圈的大型语言模型,部分网友并不买账,有人认为彭博此次只发布报告,不发布模型,颇有些“雷声大雨点小”之意。 也有网友认为,彭博赶在愚人节之前发布,可能在“骗人”。 ChatGPT为彭博点赞...
从BloombergGPT看金融行业机遇
AI金融助手

从BloombergGPT看金融行业机遇

#4月财经新势力# BloombergGPT是由彭博社开发的自然语言处理模型,专门用于金融数据分析。它有可能通过提供实时金融数据分析和改进决策过程来彻底改变金融行业。在金融领域使用GPT模型仍处于早期阶段,但预计在未来几年内会快速增长。 BloombergGPT是一种基于自然语言处理和机器学习的AI技术,可以用于金融领域的场景分析和预测。它可以自动分析和理解大量的金融数据,包括新闻、报告、社交媒体等,从而提供有关市场趋势、公司业绩、政策变化等方面的见解和预测。这种技术的优势在于它可以处理大量的非结构化数据,并从中提取有用的信息,使得金融决策更加精准和高效。此外,AI技术还可以帮助金融机构进行风险管理、投资组合优化等方面的工作,提高业务效率和风险控制能力。 BloombergGPT场景分析以及AI在金融方面的优势: 1. 场景分析BloombergGPT可以用于以下场景: – 金融新闻分析:BloombergGPT可以自动分析金融新闻和公告,并提取其中的关键信息,帮助投资者更好地理解市场动态和趋势。 – 财务报表分析:BloombergGPT可以自动分析财务报表,并提供准确的财务分析和预测。 – 市场预测:BloombergGPT可以根据历史数据和市场趋势,提供准确的市场预测和趋势分析。 2. AI在金融方面的优势 – 自动化:AI可以自动化处理大量的金融数据和信息,提高数据分析和决策的效率和准确性。 – 预测能力:AI可以通过分析历史数据和市场趋势,提供准确的市场预测和趋势分析,帮助投资者做出更明智的投资决策。 – 风险管理:AI可以通过分析大量的金融数据和信息,帮助金融机构和投资者更好地识别和管理风险。 – 个性化服务:AI可以根据用户的需求和偏好,提供个性化的金融服务和建议,提高用户的满意度 举个例子,假设一家投资公司想要了解某个行业的市场趋势和前景,他们可以使用BloombergGPT来分析相关的新闻、报告和社交媒体数据。BloombergGPT可以自动处理这些非结构化数据,并从中提取出有关该行业的关键信息,如市场规模、增长率、竞争情况等。这些信息可以帮助投资公司更好地了解该行业的情况,从而制定更加精准的投资策略。 另外,BloombergGPT还可以用于风险管理方面。例如,一家银行可以使用BloombergGPT来分析客户的信用评级、历史交易记录等信息,从而评估客户的信用风险。这可以帮助银行更好地控制风险,避免损失。 总之,BloombergGPT作为一种AI技术,可以帮助金融机构更好地处理和分析大量的非结构化数据,提高业务效率和风险控制能力。
金融圈注意了!BloombergGPT来了
AI金融助手

金融圈注意了!BloombergGPT来了

ChatGPT引爆的AI热潮也“烧到了”金融圈,彭博社重磅发布为金融界打造的大型语言模型(LLM)——BloombergGPT。 3月30日,根据彭博社最新发布的报告显示,其构建迄今为止最大的特定领域数据集,并训练了专门用于金融领域的LLM,开发了拥有500亿参数的语言模型——BloombergGPT。 报告显示,该模型依托彭博社的大量金融数据源,构建了一个3630亿个标签的数据集,支持金融行业内的各类任务。该模型在金融任务上的表现远超过现有模型,且在通用场景上的表现与现有模型也能一较高下。 一般来说,在NLP领域,参数数量和复杂程度之间具有正相关性,GPT-3.5模型的参数量为2000亿,GPT-3的参数量为1750亿。 关于BloombergGPT 报告指出,研究人员利用彭博社现有的数据,对资源进行创建、收集和整理,通过构建迄今为止最大的特定领域数据集来完成BloomberGPT,并基于通用和金融业务的场景进行混合模型训练: 彭博社主要是一家金融数据公司,数据分析师在公司成立的四十年的时间里收集了大量的金融文件,拥有广泛的金融数据档案,涵盖了一系列的主题。我们将这些数据添加到公共数据集中,以创建一个拥有超过7000亿个标签的大型训练语料库。使用这个训练语料库的一部分,我们训练了一个具有彭博风格的,达500亿参数的模型,该模型是根据Hoffmann和Le Scao等人的指导方针设计,基于通用和金融业务的场景进行混合模型训练。结果表明,我们的混合训练方法使我们的模型在金融任务上的表现大大超过了现有的模型,而在通用场景上的表现则与之相当甚至优于现有模型。 1.BloombergGPT优势:特定领域模型仍有其不可替代性且彭博数据来源可靠 在论文中,彭博社指出,现阶段,通用的自然语言处理模型可以涵盖许多领域,但针对特定领域模型仍有其不可替代性,因彭博社的大多数应用均为金融领域,着手构建了一个针对金融领域的模型尤其优势,同时可以在通用LLM基准测试上保持竞争力: 除了构建金融领域的LLM外,本文的经验也为其他研究领域的专用模型提供了参考。我们的方法是在特定领域和一般数据源上训练LLM,以开发在特定领域和通用基准上表现优异的模型。此外,我们的训练数据不同于传统的网络爬取数据,网络上的数据总有重复和错误,但我们的数据来源可靠。 2.BloombergGPT的训练数据集: BloombergGPT的训练数据库名为FINPILE,由一系列英文金融信息组成,包括新闻、文件、新闻稿、网络爬取的金融文件以及提取到的社交媒体消息。 为了提高数据质量,FINPILE数据集也使用了公共数据集,例如The Pile、C4和Wikipedia。FINPILE的训练数据集中大约一半是特定领域的文本,一半是通用文本。为了提高数据质量,每个数据集都进行了去重处理。 对金融领域的理解更准 报告指出,在金融领域中的自然语言处理在通用模型中也很常见,但是,针对金融领域,这些任务执行时将面临挑战: 以情感分析为例,一个题为“某公司将裁员1万人”,在一般意义上表达了负面情感,但在金融情感方面,它有时可能被认为是积极的,因为它可能导致公司的股价或投资者信心增加。 报告指出,从测试来看,BloombergGPT在五项任务中的四项(ConvFinQA,FiQA SA,FPB和Headline)表现最佳,在NER(Named Entity Recognition)中排名第二。因此,BloombergGPT有其优势性。 测试一:ConvFinQA数据集是一个针对金融领域的问答数据集,包括从新闻文章中提取出的问题和答案,旨在测试模型对金融领域相关问题的理解和推理能力。测试二:FiQA SA,第二个情感分析任务,测试英语金融新闻和社交媒体标题中的情感走向。测试三:标题,数据集包括关于黄金商品领域的英文新闻标题,标注了不同的子集。任务是判断新闻标题是否包含特定信息,例如价格上涨或价格下跌等。测试四:FPB,金融短语库数据集包括来自金融新闻的句子情绪分类任务。测试五:NER,命名实体识别任务,针对从提交给SEC的金融协议中收集金融数据,进行信用风险评估。对于ConvFinQA来说,这个差距尤为显著,因为它需要使用对话式输入来对表格进行推理并生成答案,具有一定挑战性。 华尔街见闻就这个问题专门询问了ChatGPT,ChatGPT认为BloombergGPT是一项很有意义的技术进步: 它是专门为金融领域开发的一种语言模型,可以更好地处理金融领域的数据和任务,并且在金融领域的基准测试中表现出色。这将有助于金融从业者更好地理解和应用自然语言处理技术,促进金融科技的发展。同时,BloombergGPT还可以为其他领域的语言模型的发展提供参考和借鉴。总的来说,BloombergGPT是一个有益的技术创新。 出行福利,快来领取滴滴福利券包
BloombergGPT横空出世!彭博打造的金融圈专用GPT来了……
AI金融助手

BloombergGPT横空出世!彭博打造的金融圈专用GPT来了……

财联社3月31日讯(编辑 牛占林)当地时间周四稍晚,彭博社发布了专门为金融领域打造的大型语言模型(LLM)——BloombergGPT,引发投资者关注,这将对金融市场产生何种影响? 彭博社是全球最大的财经资讯公司,在公司成立的40年的时间里,收集了海量的金融市场数据,拥有广泛的金融数据档案,涵盖一系列的主题。使用该公司数据终端的客户遍布全球,包括交易员、投行、美联储、美国其他官方机构以及全球各大央行等。 基于LLM的生成式人工智能(AI)已经在许多领域展示了令人兴奋的新应用场景,但是,金融领域的复杂性和独特的术语意味着可能需要特定的语言模型,拥有巨大优势的彭博自然不甘落后,于是开发了拥有500亿参数的语言模型BloombergGPT。 据彭博社发布的报告显示,BloombergGPT已经接受了广泛的金融数据的训练,以支持金融行业内各种各样的自然语言处理(NLP)任务。它是专门为金融领域开发的一种语言模型,可以更好地处理金融领域的数据和任务。 报告指出,研究人员利用彭博社现有的数据,对资源进行创建、收集和整理,通过构建迄今为止最大的特定领域数据集来完成BloomberGPT,并基于通用和金融业务的场景进行混合模型训练。 作用与优势 彭博声称,BloombergGPT将协助彭博改进现有的金融NLP任务,如情感分析、命名实体识别、新闻分类和问答等。 此外,BloombergGPT将为整合彭博终端上的大量数据提供新机会,以更好地帮助公司的客户,同时将AI的全部潜力带入金融领域。 报告显示,该模型依托彭博社的大量金融数据源,构建了一个3630亿个标签的数据集,支持金融行业内的各类任务。 与此同时,该数据集还与一个3450亿标签的公共数据集结合,创建了一个包含超过7000亿标签的大型训练语料库。 这使得该模型不仅在金融任务上的表现远超过现有模型,且在通用场景上的表现与现有模型也能一较高下。 彭博首席技术官Shawn Edwards表示:“我们认为具有金融领域特点的大型生成性LLM具有巨大价值,原因有很多——少量样本学习、文本生成、对话系统等。我们很高兴能开发出第一个专注于金融领域的LLM。BloombergGPT将使我们能够解决许多新类型的应用,同时它的性能优于为每个应用定制的模型,且上市时间更快。” 彭博机器学习产品和研究团队负责人Gideon Mann解释说:“机器学习和NLP模型的质量取决于你输入的数据。得益于彭博40年间积累的金融文件,我们得以精心打造一个大型、干净、特定领域的数据集来训练一个最适合金融用途的LLM。我们很高兴能够利用BloombergGPT改进现有的NLP工作流程,同时也思考新的方法将这个模型投入使用,为我们的客户带来惊喜。”
金融AI行业产业规模、产品占比及金融计算机视觉核心市场规模分析
AI金融助手

金融AI行业产业规模、产品占比及金融计算机视觉核心市场规模分析

由于金融机构往往具有信息安全要求高、数据处理量大且信息基础设施建设较为完善的特征,人工智能技术得以较早在金融领域营销、合规、风控等多元化场景实现落地应用并得到长足发展。据统计,2021年AI金融核心市场规模达到296亿元,带动相关产业规模677亿元,到2024年,核心市场规模达到516亿元,CAGR=25%,带动相关产业规模1211亿元。 2020-2024年中国金融AI相关产业规模情况 资料来源:公开资料,华经产业研究院整理 金融机器学习产品由于与金融机构多业务场景均可密切结合且产品能力在海量高质金融业务数据助力下得到快速提升成为市场主要拉力之一,2021年金融机器学习产品占AI+金融核心产品市场规模比重达42.2%。 2021年金融AI产品市场规模占比情况 资料来源:公开资料,华经产业研究院整理 据统计,2021年AI金融领域计算机视觉核心产品及服务市场规模达到75亿元,预计到2024年核心产品及服务市场规模将达到106亿元,2019-2024年CAGR=11.6%。金融行业内,计算机视觉产品及服务在深度学习算法的加持与带动下在人脸识别及证照识别等应用场景得到了广泛的应用。 2019-2024年中国金融计算机视觉核心市场规模 资料来源:公开资料,华经产业研究院整理 本文节选自华经产业研究院发布的《2022年金融AI行业发展现状及趋势分析,金融AI技术与新兴技术的结合将创造出更加创新和高效的金融服务模式和商业模式「图」》,如需获取全文内容,可进入华经情报网搜索查看。
又一家华尔街大行将推出一款AI金融产品:背后技术由OpenAI支持
AI金融助手

又一家华尔街大行将推出一款AI金融产品:背后技术由OpenAI支持

财联社9月9日讯(编辑 周子意)未来,去找摩根士丹利财务顾问讨论投资的富有客户可能会有一种不同的体验:有一个聊天机器人旁听他们的谈话。 据报道,摩根士丹利在对1000名金融顾问进行了几个月的测试后,将于本月推出一款生成式人工智能(AI)聊天机器人。值得一提的是,这款生成式人工智能将有由OpenAI开发。 该聊天机器人可以作为虚拟助手可以帮助金融顾问、银行家快速查找研究或表格,而不是在数十万份文件中筛选。 此外该行还在开发该技术的一些功能:最终将在客户允许的情况下,为谈话创建会议摘要、起草后续电子邮、建议下一步行动、更新银行的销售数据库、安排后续约会、并学习如何帮助顾问管理客户在税收、退休储蓄和遗产等领域的财务状况。 虽然聊天机器人将为金融顾问提供见解,但如何给出投资建议仍将是人类的职责。 Cucchiara指出,“人类顾问仍然处于中心地位…目前,员工们认为这项技术是一种有用的工具,并不担心他们会被机器人取代。” “AI的影响堪比互联网的出现” 人工智能计划是摩根士丹利推动其财富部门发展战略的一部分,该部门第二季度净收入飙升16%,达到创纪录水平,新客户资产增长900亿美元。 该公司首席执行官戈尔曼(James Gorman)的目标是将管理的资产规模达到10万亿美元。他牵头进行了一系列重大交易,为财富管理业务注入了更多资金。 摩根士丹利财富和投资管理首席信息官Sal Cucchiara表示,人工智能的影响将非常大,可能堪比互联网的出现。 Cucchiara是推动该银行进军人工智能领域的高管之一,他不断在硅谷寻找潜在的技术供应商,他在2022年与OpenAI的高管会面,当时快速增长的应用程序ChatGPT尚未成为主流。 他称,“很快就清楚了,我们需要与他们合作,他们远远领先于其他所有人,” 摩根士丹利联席总裁兼财富管理主管Andy Saperstein曾与OpenAI首席执行官萨姆·奥特曼(Sam Altman)和该公司技术人员Boris Power讨论合作事宜。 他们在夏天签署了一项协议,根据协议,摩根士丹利方面希望参与财富管理产品的开发。 在生成式人工智能应用方面,摩根士丹利并不是唯一一家。 今年6月,摩根大通任命Teresa Heitsenrether为首席数据和分析官,领导该行采用人工智能。 美国银行的虚拟助手Erica自2018年推出以来,已与客户进行了超过10亿次互动。 穆迪分析的首席产品官Nick Reed透露,该公司在与OpenAI和微软合作开发一款可供客户使用的研究助手。 咨询公司埃森哲的全球银行业主管Michael Abbott表示,大型银行在采用人工智能方面是金融公司中最先进的,同时资产管理公司、交易员和保险公司也在部署人工智能。
清华系发布全新金融AI,数秒完成金融数据大海捞针!金融民工直呼要失业
AI金融助手

清华系发布全新金融AI,数秒完成金融数据大海捞针!金融民工直呼要失业

新智元报道   编辑:编辑部【新智元导读】专业数据分析师要危了!国产首款金融数据分析AI诞生,数秒即可完成PB级金融数据「海底捞针」,普通用户无需编程就能搞定数据分析。在探索人工智能领域的浪潮中,针对个人消费者C端的AI解决方案的实际落脚点,似乎依旧沿着一条较为狭窄的路径发展。美国著名科技风投机构a16z最新的研究报告透露,当前市面上颇受欢迎的五十种C端AI产品,主要集中于视频、音频、图像和文本处理的智能工具领域,这一趋势反映出面向C端的应用依然有待进一步拓展和深化。在此背景下,国内AI创新企业功夫源科技重磅推出「功夫量化」AI应用,这是针对金融行业的一次跨越性进击。它能够在PB级金融数据海洋中,以秒级速度进行精准的信息搜寻,国内首款面向普通投资者的AI金融数据分析产品。其核心竞争力在于它能够对繁杂的数据进行深度筛选,洞悉背后的价值信息,并据此生成新的、有力的洞见,帮助用户做投资决策。在过去,进行这类复杂的金融分析通常要求分析师具备高级编程技能,并需要在专业金融数据库上执行一系列开发工作。而现在,借助功夫量化的AI技术,即使用户不具备编程能力或使用专业工具的经验也能轻松进行分析。他们只需通过免费的小程序或桌面客户端,以类似ChatGPT的问答形式,即可实时获取所需的分析结果。例如,用户可以轻松查询:「今年3月每天收盘前30分钟逐笔成交数量最多的股票」「中国石油和上汽集团在今年1月3号开盘后10分钟内每分钟逐笔成交数之差」「2024年宁德时代三十分钟内涨幅超过1%的随后五分钟的涨跌幅度」 小程序版:手机端亦可轻松获取TB级数据的AI测算,洞悉市场秘密 桌面客户端:市面上唯一基于l2数据进行因子研究和因子生成的AI计算工具这种能力让普通投资者也能深入挖掘那些曾经只有专业数据分析师才能触碰的深层信息,自由探索数据海洋中的线索,从而揭示新的投资和交易机会。而这对于那些习惯于通过复杂算法和策略来寻求盈利的股票操盘手和期货交易者来说,无疑将面临工作形态与流程的变革——过往,他们可能需要依赖IT开发者或数据分析师来实现复杂策略,如今,在AI的帮助下,他们能够独立完成这些任务,这大幅提升了工作效率,也为他们的决策提供了更直接、更精确的支撑。产品一经推出,已经有金融从业者调侃并感叹,又一波失业大潮要来了! AI能力强,还需优质数据打底 目前,功夫量化已经为用户提供了覆盖国内全市场的金融市场Level2数据。这种数据的深度和广度,使得用户不仅能够以更高精度分析市场动态,还能更精确地分析市场动态并制定相应的交易策略。Level 2数据的稀缺性和价值体现在其提供比传统市场数据更丰富的交易层面信息,包括订单簿的所有买卖报价级别,这是洞察市场供需状态、预测价格走势并把握交易时机的关键因素。在数据服务行业,Level 2数据往往价格不菲,通常超过10万元人民币,且对于终端用户来说,其使用不仅停留在昂贵的获取成本上,还包括了必要的存储和计算基础设施的搭建。这一系列的技术和财务门槛,自然将许多个人用户和小型机构排除在外,传统上,只有资金雄厚的机构才能够应对这样的成本投入。针对于此,功夫量化团队所开发的全新无服务架构改变了这一局面,通过云计算平台提供弹性算力服务,使得用户无需前期投资即可实现数据的即时在线处理和分析。通过这种创新模式,高成本的数据服务以更加亲民的方式呈现给了C端用户,同时保持专业级的数据处理能力。不同用户之间的计算任务完全隔离在各自的沙盒内,这不仅保障了数据安全,也确保了高并发环境下的优良用户体验。功夫量化团队的产品经理透露,除了现有的Level 2数据,今年内还将进行一系列的数据升级,包括添加基本面数据、另类数据等多种数据类型。这些升级将帮助用户在功夫量化产品内获得更加完整的市场图景。 金融版的特征工程,因子计算创新应用 在机器学习的应用过程中,特征工程是确保模型有效性的关键步骤。在金融行业,这一概念对应着因子的提取和使用,这些因子常常是投资决策和量化策略的基石。针对这种场景,功夫量化还特别推出了基于因子计算的AI Infra—高性能金融因子工厂,支持用户通过功夫量化的先进无服务算力设施来自定义和部署因子计算任务,进而提高金融分析和交易策略的精准度。并通过开放式的API在其他系统内连接使用计算结果。高性能金融因子工厂特点如下:自定义因子计算:用户可根据个人或机构的特定需求,自定义因子计算逻辑。为投资策略带来了极大的灵活性和针对性,满足每个市场参与者采用其独到的视角和策略。无服务算力设施:功夫量化的无服务架构允许用户在虚拟化的隔离环境中运行因子计算任务,无需担心底层硬件的维护和升级。这种云基础设施支持高弹性和可扩展性,确保了计算资源的即时可用性和高效执行。开放式API接口:通过开放式API,用户可以轻松地将因子计算结果集成到其他系统中,无论是内部的交易系统还是外部的分析工具。这种高度的互操作性极大地增强了因子应用的灵活性和广泛性。以上三点共同构成了强大的运营壁垒,为用 户提供个性化、低维护和高度互联的量化交易解决方案的同时,也为商业模式创新奠定了坚实基础。 在特征工程领域,国外已经出现AI基础设施独角兽,例如Tecton就为机构用户提供通用的数据特征管理基础设施。 相比之下,功夫量化专注于金融行业,提供了更为定制化和行业特定的解决方案,包括专业数据、定制工作流集成、交易执行无缝衔接等特点。 同时通过功夫量化特有的产品设计,使得这些功能既能满足专业投资机构的需求,也能完全开放给个人用户自由使用。 AI加速,全能交易Agent即将到来 功夫量化的未来发展计划表明,他们致力于将人工智能功能更全面地融入金融交易的各个环节,从数据分析到实盘交易。这种全链路的AI增强不仅将改变传统的交易方式,还预示着AI在金融领域应用的新纪元。不久后的功夫量化平台将通过高级的用户界面和自然语言处理技术,使用户能够直接与系统对话,描述他们的交易需求和目标。AI Agent将解析这些需求,自动执行以下步骤: 分析数据,识别关键因素 自动生成策略代码 在高精度的回测系统上测试策略 可视化展示回测结果 自动筛选并推荐最佳交易策略 这种交互方式将极大地简化用户的操作流程,降低进入门槛,使金融交易更加智能化和个性化。 别具一格的技术创新型团队 自2017年成立以来,功夫量化团队始终保持一个精练而高效的团队规模。尽管团队成员仅有三十人,但他们覆盖了包括核心研发、产品设计、质量测试、运营管理以及商务等各个职能领域。这种全面而紧凑的团队配置使得功夫量化能够灵活且高效地处理复杂的任务和项目,并且具备同时交付面向大型金融机构的专业软件项目和面向C端用户的大规模在线服务的能力。功夫量化创始人董可人本科毕业于清华大学计算机系,并于利物浦大学计算机系取得博士学位,在多年以前就在知乎等知识平台上凭借在量化交易领域的专业知识获得过大量关注。团队内的其他成员也都非常稳定,创始成员们已经有近十年的合作经验。董可人是早期知乎上金融领域前十答主,也是国内最早的量化布道者在传统金融技术领域,多数团队由于对稳定性和安全性的高需求,往往采用了较为保守的技术栈。与此形成鲜明对比的是,功夫量化团队展示了一种创新的技术实施策略和研发流程,这不仅使他们在技术前沿保持领先,同时也确保了产品的高性能和高稳定性。功夫量化团队在其开发流程中集成了如GitHub、Airtable、Zapier、Hookdeck等工具,这些工具支持高效的代码管理、项目管理和自动化流程。通过采用这些前沿技术与工具,有效缩短开发周期,并同时保持软件质量和稳定性,这使得功夫量化能够仅维持少量人力的情况下即可同时支持专业软件交付和运营大规模在线服务。 One More Thing:开源项目 由于行业内高强度的竞争属性,金融业的交易者除了关注策略能力,也非常关注交易执行环节的系统性能,需要尽可能的降低交易信号执行时的系统延迟,才能确保自己获得更好的交易机会。功夫量化在业内一直以来都以极致的低延迟系统性能为知名,不仅在性能上表现出色,更是开源理念的推行者和贯彻者。除了提供系统核心组件的开源代码,功夫量化团队还打造了完整的在线开源站点(www.libkungfu.cc),提供详细的文档、版本管理、预编译的安装包下载等多项支持。 功夫量化开源站提供了详细的版本追踪、文档和产品下载信息在GitHub上提供的开源仓库,已经收收获3K+加星: 项目地址:https://github.com/kungfu-origin/kungfu 尽管高性能的交易核心系统有很高的商业价值,但功夫量化团队采取了一种在金融科技领域相对少见的开放策略,并采用了开放性极高的Apache License 2.0协议,不会限制用户基于代码进行商业开发。据了解,在竞争激烈的量化私募行业,已经有相当多的公司基于功夫量化的开源产品来打造自己的核心系统,其中也不乏大型头部机构。功夫量化提供的SDK和插件化包管理机制极大地简化了开发人员创建定制交易终端产品的过程。这种高度模块化的设计使得开发者可以轻松集成AI、数据服务、因子计算等功能,而不必从零开始构建。通过功夫量化提供的API,用户只需少量的开发工作,就能实现跨平台、带有图形界面的自定义产品,并且支持Python、JavaScript、C++等多种开发语言,灵活度爆表。最后,想要体验功夫量化的最新产品,可以直接点击下方小程序,赶快来试一试吧: 参考资料: https://www.kungfu-trader.com https://libkungfu.cc https://github.com/kungfu-origin/kungfu