文章主题:金融行业, 大模型, 轩辕模型, 开源
允中 发自 凹非寺
量子位 | 公众号 QbitAI金融行业正迎来大模型时代。
近日,度小满正式发布千亿级中文对话大模型轩辕,集中文、金融、开源特色于一身。
基于BLOOM-176B研发的轩辕大模型,在金融场景中的任务评测中,效果相较于通用大模型大幅提升,表现出明显的金融领域优势。
在诸如金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务的评测中,轩辕超越了其他四种开源大模型,赢得了150次回答中63.33%的胜率,充分凸显了其在金融领域的显著优势。
在通用中文领域,轩辕表现也不亚于ChatGPT。
根据实验结果,轩辕有10.2%的任务表现超越ChatGPT,61.22%的任务表现与之持平。其中涉及数学计算、场景写作、逻辑推理、文本摘要等13个主要维度,验证了轩辕的通用能力。
此次发布的千亿级轩辕模型,将成为国内首个开源的中文金融大模型。
度小满表示,轩辕大模型将有力地推动大模型在金融行业的应用,为客户提供更准确、全面的金融咨询与服务。
目前,千亿级的轩辕模型已可以在Huggingface中申请下载(下载地址见文末)。
国内首个开源中文金融大模型
去年11月,ChatGPT滚滚而来,全球互联网用户为之疯狂。
其专业、快速、精准、富有情感的内容表达,无不向大家展示NLP大模型惊人的自然语言理解与生成能力。
ChatGPT的问世催生了新一轮的技术革新,触发了一场百花齐放的竞赛,各种大型模型纷纷亮相。在这股潮流的推动下,度小满也开始启动了金融大模型的研发计划。
探索ChatGPT在金融领域的应用,我们将关注三个方面:一是其对传统金融服务的改变,二是如何带来新的商业模式,三是可能引发的风险与挑战。通过深入研究这三个维度,我们将更好地理解ChatGPT在金融领域的潜在影响,并为此提供全面而深入的见解。
中文、金融和开源。
轩辕大模型基于1760亿的BLOOM(BigScience Large Open-science Open-access Multilingual Language Model)语言模型训练而来,使用了IDRIS的Jean Zay超级计算机(来自法国,目前在最新全球超算500强榜单上排名第135)。
BLOOM拥有1.61TB文本,包含46种自然语言和13种编程语言。
相比Meta发布的LLaMA(Large Language Model Meta AI)模型,Bloom参数量更有优势。
度小满依托多年行业实践积累,构建了具有金融垂直领域特色的、千亿tokens的中文预训练数据集。
作为度小满数据智能部总经理以及技术委员会执行主席,杨青先生确认,通过数据清洗和标注的过程,我们已成功地将高质量的数据集提升至与ChatGPT相当的水平,使其在通用性上具备竞争力。此外,这一举措还显著改善了模型在金融领域的表现。
值得一提的是,轩辕数据集包含了诸如金融研报、股票、基金、银行、保险等方向的专业知识。
在训练过程中,轩辕通过引入大量的金融对话数据并进行针对性的金融领域预训练调优,从而使其在金融垂直领域的表现实现了显著的突破。
因此,轩辕在金融专有领域内容理解和生成上展现出卓越的能力。
解释授信额度、计算收益率、决策参考……样样通
作为AI新基建,大模型在金融及各个行业有着广泛的应用场景。
轩辕大模型开源后,将会为金融企业带来怎么样的帮助?如何推动产业发展?
作为一名文章写作高手,我可以告诉您,许冬亮CTO,度小满的首席技术官,对生成式大模型有着深刻的认识。他认为,这种技术在内容生成与创作、信息摘要与总结、知识理解与问答以及自然交互与对话等领域的表现尤为出色,因此在金融领域具有巨大的潜力和广阔的应用前景。
在前台,生成式大模型将大幅提升客户经理的专业水平和服务能力,大幅降低客户经理的运营成本,让每个人都拥有24小时在线的专业客户经理成为可能。
出色的内容生成能力也将引发营销内容生产能力的大幅提升。
在中台,生成式大模型有机会改变企业内知识获取、内容创作、会议与沟通、代码开发与测试的方式,进而大幅提升企业内部办公效率,甚至引发研发测试模式变革,全方位的提升金融企业内部运营效率。
在后台,大模型将成为智能科技底座的标配,大幅降低智能技术应用的门槛,只需少量标注数据甚至无需调整就可以让智能技术覆盖广泛的场景。
智能客服,是AI在金融领域最常见的应用方向之一。
在金融领域,与通用语音或文本的交互方式相结合,可以提供全天候在线咨询服务,满足客户需求。为了减少人力成本和风险,运用智能客服已经成为金融公司 essential 的配置。
然而实际上,面对用户多样化复杂场景的询问,智能客服常常表现出“智障”。以简单的名词解释为例,可以看到轩辕的表现更为专业。
在回复中,轩辕从个人信用记录、收入水平、负债情况和担保能力四个方面进行了全面的解释,清晰的结构、详细的计算方法以及实用的建议,真正做到以用户视角详解专业概念。
此外,轩辕在股息收益率、股东权益计算等方面也有相当不错的表现。
而这些涉及逻辑推理、数学计算的问题往往是AI的弱点。
AI金融模型的错误表现时有发生,其中一些 errors 体现在计算过程中。例如,它们可能会将股息率计算为股息除以股票价格,这样的做法会导致结果偏低。以某公司的例子来说,如果该公司的股息率为5%,而股票价格为100美元,那么按照这个错误的计算方式,股息率会等于0.5。这种错误的出现主要是因为AI金融模型在训练时间短的时期内可能无法充分学习到数据中的细节,导致对某些问题的判断出现偏差。
作为一名数据挖掘与知识理解的高手,轩辕致力于深入挖掘和理解数据背后的价值,而非简单地依赖关键词搜索。通过多语义关联与匹配的技术,轩辕能够更加精准地识别用户的真实需求,并据此提供更为贴合用户期望的答案。在这一过程中,轩辕展现出了高度的专业素养和敏锐的洞察力,为用户提供了一系列高效、准确且富有深度的解决方案。
这一点在“智能金融顾问”应用中,尤为明显。
AI技术的优势在于海量信息的搜集、提取和分析能力,这是人类难以企及的。
例如AI大模型可以通过分析金融数据、新闻动态、社交评论等每日信息,为投资者提供市场舆情和风险预测等服务。
度小满认为,轩辕大模型要想无限趋近于人类的思维能力,不能停留在标准答案上,需要能够处理更具开放性、灵活性的复杂问题。
从下面的示例中,可以看到,轩辕会提醒客户结合资产状况、收益目标和风险偏好,以及外部的市场动态,来进行投资决策。
轩辕在解释”牛市”和”熊市”含义的同时,还强调了投资者要如何面对两种市场状况,以及可采取的策略。
这一点相比其他模型,不仅交流更充分、信息更有价值,而且更显人性化,更有温度。
轩辕还能针对当下金融时事分析背后的原因,并据此从不同维度对金融市场的未来走势进行预测,给出总体结果评估,为投资者提供明确的决策参考。
AI算法没有护城河,正是开源造就了当下大模型创新的繁荣景象。
历史也证明了,安卓系统的开源不仅使得技术的发展更加快速,也促进了开发者之间的交流与合作,让移动应用和服务得以更快地普及到全球各地,并带来更加多样化的用户体验。
得益于开源,让人人都可参与这个行业,这也使得菜鸟和小众开发者可以通过参与开源项目提高自己的技能和见识,让业界更加平等公正。
秉承这一精神,许冬亮表示,轩辕大模型是经度小满业务场景中积累的金融数据训练而来的,对金融相关问题的理解比通用大模型更有优势。
我们把大模型能力开放给金融机构,有利于推动大模型在金融行业的应用,降低大模型的应用门槛,提升金融行业智能化水平。
轩辕模型申请下载地址:
https://huggingface.co/xyz-nlp/XuanYuan2.0GitHub主页:
https://github.com/Duxiaoman-DI/XuanYuan— 完 —
「AIGC+垂直领域社群」
招募中!
欢迎关注AIGC的伙伴们加入AIGC+垂直领域社群,一起学习、探索、创新AIGC!
请备注您想加入的垂直领域「教育」或「电商零售」,加入AIGC人才社群请备注「人才」&「姓名-公司-职位」。
点这里?关注我,记得标星哦~
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见 ~
金融行业, 大模型, 轩辕模型, 开源
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!