让大模型在金融产业用起来 百融云创大模型问世
金融是人工智能技术渗透最为广泛的领域之一,大模型或许将在金融领域率先开启“iPhone时刻”。 自从OpenAI推出ChatGPT大模型开始,通用大模型在全球范围内迎来爆发式增长,多家巨头型企业开始了军备竞赛。但与市场的喧嚣不同的是,百家争鸣的背后,是大模型如何能够接地气,真正在产业落地的困境。 当通用大模型运用在特定领域内,比如医疗、金融等,由于缺乏领域内专业和庞杂的知识作为依托,其能力表现往往不尽如人意,大模型发展路径也因此分出一条岔路,市场中越来越多的企业开始将目光投向了产业大模型,在金融领域这一趋势尤为强烈。 01「 两次AI浪潮下的百融云创」百融云创是国内率先致力于将AI技术与金融场景结合的科技公司之一,它的发展历程是两次AI浪潮在金融领域叠加向前的一个缩影。2014年百融云创成立,恰逢AI第一波浪潮正风起云涌,百融云创将创新重点聚焦在判别式AI上。判别式AI的技术特性决定了它不需要穷尽所有信息,而只需要部分较为精准信息,即能给出明确的决策结果,进行“好”与“坏”的分类,“是”与“否”的判别,这对于彼时正快速线上化、数字化的金融机构来说,判别式AI占据了天时地利人和。百融云创用判别式AI敲开金融机构的大门,以保守稳健著称的金融机构,也调整身姿全面拥抱人工智能。过去几年间,基于判别式人工智能,百融云创帮助金融机构在信用评估、金融反欺诈、风险预警、贷后管理等多个场景实现了AI产业化落地。当下,以生成式AI为代表的第二波AI浪潮正席卷而来。百融云创作为上一波技术革命的先行者,也率先行动起来。百融云创基于深度学习Transformer框架,结合NLP、智能语音等技术,打造了场景驱动的产业大模型——BR-LLM。百融云创自主搭建了大模型底层框架,通过深度微调能支持百亿级参数的训练。百融云创大模型主要提供AI开发、智能交互、分析决策的三种服务能力。在开发端,不仅适用于金融机构不同开发能力的技术人员,也适用于非技术人员实现自动化开发。在交互端,提供语言理解、多轮对话、语言处理、文本生成“听、说、读、写”四种能力,适用于金融营销、客服等场景;在决策端,为金融全生命场景的智能决策提供更全面的信息,为决策效率的提升注入更为强大的动能。百融云创希望让大模型变成像水、电一样供金融机构按需使用,实现金融领域的模型即服务。02「 百融云创大模型将带来哪些产业惊喜?」在AI开发层面,百融云创大模型展现出强大的代码自动化生成能力。在金融机构中,传统的机器学习模型开发在某种程度而言是一种“手工作坊”的模式,一个场景一个模型,模型之间的经验也不能互相积累和复用。百融云创大模型的自动生成能力将颠覆这一现状,面向不同金融场景的业务诉求,百融云创大模型工程师只需要下达清晰的指令,用文字描述出需求,即能自动生成模型,极大提升机器学习的开发效率和生产模式。开发人员的角色也会随之发生变化,如果说此前开发人员只需要做好技术的工作,有了大模型的加持开发人员还要做好“提问者”的角色。在智能交互方面,百融云创大模型能提供“真人级”对话效果,对客户的语音识别准确率可达到99%以上,每日进行超过亿级规模的自动交互。同时,大模型还有“高人一筹”的表现。比如,当银行工作人员向客户推销金融产品时,客户问到一些如近十年某基金收益率这样的专业性问题,工作人员无法及时给出准确的反馈,客户可能就此流失。而大模型跨模态、跨语言的深度语义理解与生成能力,在处理复杂和专业性金融知识上,具有人工所不具备的能力。一家大型银行动辄几千万的客户,大模型将会为每名客户提供一个7×24小时专属服务,这将为金融客服、智能投顾、产品营销等带来质的飞跃。在分析决策方面,以判别式AI为代表的小模型已经发挥重要作用,大模型的进场将进一步激发小模型的能量。数字化转型的快速推进,使得银行内部形成了大量的非结构化数据,这对信息质量要求比较高的判别式AI而言是一片无法触及的领域。当训练的信息量超过一定阈值,大模型就会出现“涌现现象”,即“在较小的模型中不存在,但在较大的模型中存在的能力”。百融云创大模型能够凭借强大的信息挖掘能力,唤醒金融机构大量沉积的信息,就像是一块巨大的磁石,做关键信息的抽取,为判别式小模型进行赋能。比如在风险监控、信用评估、反欺诈等场景下,大模型能挖掘出小模型无法覆盖到的区域,丰满信息的维度。大模型对于小模型并非是替代或“消灭”,相反,两者将是相互协作的关系,大模型与小模型相互搭配,将大大提升金融决策的精准度和效率。03「“大”非万能 产业的knowhow更为重要」与普通模型相比,大模型具有更加复杂和庞大的网络结构、更多的参数和更深的层数。但更大规模,并不等于更强模型能力。产业大模型考验的是算力+行业knowhow+模型精调的综合能力。其中行业knowhow尤为关键,这是专家经验、行业知识、组织能力、工程能力的综合体,而这也恰恰是垂直企业的竞争优势所在。比如在银行运营环节,由于模型都是黑盒模式,由模型制定出的营销策略,很难让一线执行的客户经理完全信服,当模型制定的策略置于现实情况产生了偏差,此时该如何协调客户经理与AI之间的关系?或者由于外部环境发生变化,如疫情对居民收入带来了影响,金融机构原有的信贷模型与现实情况就会产生偏差,此时要如何优化原有的参数?如果仅有大模型而没有足够深入的产业knowhow是远远不够的。百融云创很多同事来自于世界各著名金融机构,对于国内外金融产业发展拥有深刻的理解,截至目前百融云创已经为7000多家不同类型的金融机构提供服务,这些都为金融产业的knowhow积累下独有的优势。比如在某中小银行的服务中,百融云创要从数字化转型总体规划入手,逐步深入到产品和业务等多个层面。有时要协同科技部门、业务部门等多个部门,并搭配非常深厚的产业视野,才能真正深入场景,直抵产业的核心。百融云创大模型的价值和意义,是其在满足业务的真实诉求中寻找适配的技术方案,而非是为技术寻找应用的场所。04「大模型之外的多种武器」当然,必须指出的是,大模型这一变革性技术的应用面临着数据安全、模型风险等多重全新挑战。为应对这些挑战,在大模型之外,百融云创还打造了多种技术武器,共同构成了大模型应用的技术底座,这个底座由大模型、模型管理平台以及隐私计算平台共同组成,提供了从数据安全、模型开发到模型管理的整套服务生态,为大模型的安全、合规应用保驾护航。当前,已经有多家银行陆续接入百融云创大模型之上,悄然酝酿一场人机协同的智能交互和内容生产革命。ENDRECOMMEND推荐阅读 百融云创模型管理平台 开创全局统一的模型资产管理新局面 百融云创荣获华为鲲鹏展翅伙伴计划认证 国有大行数字化转型的十年|缘起信息化,走向开放化