本报记者 蒋牧云 何莎莎 上海 北京报道
数据作为新型生产要素,其重要性在金融机构运营中愈发重要。然而,多位业内人士告诉《中国经营报》记者,数据管理涉及数据的采集、存储、处理、分析和保护等多个环节,需要专业的技术支持和高效的IT系统。此外,在处理数据时,金融机构必须遵守严格的法规要求,确保数据的合法性和合规性,这进一步增加了数据管理的复杂性。
这一背景下记者也注意到,快速更新迭代的人工智能技术正在帮助金融机构进一步完善数据管理。如通过AIGC技术进行智能数据盘点、自动生成脚本等,大幅提升了管理效率。
不过,在采访中多位业内人士也都指出,金融机构数据管理仍面临不少挑战,比如目前数据质量和数据来源参差不齐,需要投入大量资源进行数据清洗和验证。
安全与降本增效成为重点
“数据二十条”、《“数据要素×”三年行动计划(2024—2026年)》发布后,国家数据局以及各省数据局接连揭牌与成立。在一系列政策推动,以及数字化大背景下,金融机构对于数据管理愈加重视。近期,国家金融监督管理总局也发布了《银行保险机构数据安全管理办法(征求意见稿)》,旨在规范银行业、保险业数据处理活动,保障数据安全,促进数据合理开发利用。
市场聚焦的重点方面,根据不久前沙利文联合头豹研究院发布的《2023年中国数据管理解决方案市场报告》,目前市场上的数据管理解决方案技术动态围绕增效降本与数据安全两大主题进行,以加强解决方案与企业数据管理能力可持续发展建设的匹配度,提高解决方案落地效果。
具体而言,通过数据的开发、治理等,能为金融机构带来什么,其中又有哪些难点?北京社科院副研究员、数据资产化研究院执行院长王鹏告诉记者,通过数据开发可以揭示出客户的偏好、市场的趋势以及潜在的业务机会,从而推动金融产品和服务的创新。通过对数据的深入分析,金融机构可以构建更精细的风险评估模型,以更好地识别、评估和管理各类风险。此外,有效的数据治理可以确保数据的质量和准确性,减少错误和重复工作,从而提升内部运营的效率。
不过王鹏也表示,金融机构在数据管理方便尚存在不少难点,比如数据管理涉及数据的采集、存储、处理、分析和保护等多个环节,需要专业的技术支持和高效的IT系统。在处理数据时,金融机构必须遵守严格的法规要求,确保数据的合法性和合规性,这进一步增加了数据管理的复杂性。与此同时,数据管理需要跨部门协作和全员参与,但不同部门之间可能存在数据壁垒和利益冲突,这会影响数据管理的效果。
一系列背景下,人工智能的迭代与升级给数据管理带来了更多可能性。根据沙利文联合头豹研究院发布的《2023年中国数据管理解决方案市场报告》,早期自动化与智能化的实现主要基于预设的规则与模型,能够一定程度上减轻数据管理团队的压力,但可实现的功能与影响的范围还很有限。随着 AI 技术提高,可实现的智能化功能得到扩展,如预测性功能、自适应功能、自然语言理解相关功能等,这些功能不仅能够让企业进一步减轻团队压力,更好地进行数据洞察,降低数据管理运维成本,还能够降低数据使用门槛,扩大数据使用对象范围,从而助力企业同时解决技术落地与组织协作的问题,让数据变得能用、好用、易用,使数据能够真正地赋能企业业务发展。
王鹏也向记者表示,人工智能技术在金融领域有多个应用场景,比如智能数据分类与存储,AI可以自动识别和分类数据,将其存储到合适的位置,便于后续的分析和使用;数据清洗与预处理,AI可以帮助自动清洗数据中的错误、重复和冗余信息,提高数据质量;以及智能数据分析与预测,AI可以构建复杂的数据分析模型,进行市场预测、风险评估等高级分析任务等。王鹏进一步表示,AI可以自动化处理大量数据,大大提高了数据处理的效率,在减少对大量数据分析师需求的同时,降低了人力成本。而AI的数据分析可以提供更准确、更深入的洞察,支持更明智的决策。
应用水平逐步提升
目前AI技术是如何在金融机构的数据管理中落地的?
在数据资产盘点场景上,中国光大银行数据资产管理部潘学芳在不久前公开的刊文中提到,目前,商业银行的数据资产盘点基本采用“自上而下”或“自下而上”方式开展,主要是通过人工梳理和标注的方法,对全量的数据资产进行摸底盘点,工作过程面临投入人员多、工作量大、时间长,以及更新不及时等问题。随着AIGC技术的兴起和广泛应用,则为智能化盘点数据资产带来了新的思路与方向。
具体而言,通过利用AIGC技术,配合专家规则与增量学习,能在一定条件下实现智能化盘点。通过在样本集中应用“非监督机器学习LDA模型+专家规则”的方法生成带标签的样本数据,极大地降低了人工标注样本的工作量。比如一个10万级别的样本数据集,仅需人工标注1万—3万,人工工作量减少70%至90%,大大减轻了人工工作成本。同时,基于“增量学习+经验池”的方法使得数据资产管理平台积累的用户反馈信息代替模型更新所必需的人工调参,实现了模型的自动更新维护。
中小金融机构方面,有业内人士向记者指出,对于部分中小金融机构而言,由于拥有独特的个性化差异。一方面受到资源限制无法直接进行全体量科技投入,另一方面也需要保持自身特色进行针对性发展。为此,在设计相关数据管理产品时需要着重轻量化并明确机构的定位及战略规划。
记者了解到,近日,神州信息(000555.SZ)“六合上甲”一体化数据智能开发平台成功中标陕西农信数据门户及数据资产管理平台建设项目。该平台融合了AIGC技术,为金融机构实现数据管理和各类应用场景提供数据开发、治理、分析等全链路解决方案,在大批量离线数据开发等领域采用自动生成脚本方法,并可自动生成单元测试脚本。同时还引入了离线数据开发脚本自动生成、流批脚本自动生成、测试脚本自动生成、自动测试和数据资产目录自动编排等技术。
神州信息方面表示,公司充分考虑陕西农信现有系统、数据资产以及业务应用的开展现状,基于不同视角构建多层次、多维度的数据资产体系,建立了数据资产目录框架。通过对陕西农信数据现状的调研,建立元数据、指标数据、数据标签、数据质量、数据服务接口等盘点规范,形成满足业务与技术要求的存量数据、新增数据的盘点方法,并以此为基础完成数据资产盘点工作,使数据有效汇聚,保障数据的一致性。按照数据安全管理要求,完成数据资产的分级分类管理,同时建立数据资产互联互通模式运营机制,实现数据门户及数据资产管理平台与DevOps(开发与运维)平台对接融合。
也需要注意的是,金融机构在数据管理过程中仍存在不少挑战。前述报告中就指出,一方面,企业加强了数据管理技术落地实践,数据管理水平正在逐步提高;另一方面,企业也面临着技术落地后仍无法充分将数据价值释放的问题,这主要源于企业在数字化转型过程中,需要带着现有 IT 架构、组织架构进行技术迭代,一味地追求新技术而没有考虑企业固有属性,会导致无法将数据价值与公司业务发展连通,如技术复杂化加重数据孤岛、技术复杂化扩大数据团队与业务团队的沟通成本等。
神州信息首席数据官黄万忠在此前的公开演讲中也提到,数据治理(管理)的起点是数据的来源和采集,目前的数据来源仍然是比较割裂,比如不同的数据属于不同的机构或者不同的版块,并没有打通;其次是数据质量有待提升;第三,数据治理是需要金融机构通盘考虑的战略层面的问题,不单单是某个系统、某个方案或某个部门的事情;第四,做数据治理也应该自下而上,以机构的业务为导向。
传播星球APP联合创始人付学军则补充道,金融机构对于数据管理的要求是在不断提高的,机构需要更高效、更安全、更智能的数据管理方式,以满足不断增长的数据需求。同时,随着数据规模的扩大和复杂性的增加,数据管理的难度也在增加,因此金融机构需要不断优化数据管理策略和技术,以应对这些挑战。这可能包括采用更先进的数据存储和处理技术、加强数据安全和隐私保护措施、提高数据质量和准确性等。此外,金融机构也需要建立完善的数据管理制度和流程,以确保数据管理的规范化和标准化。