信雅达携手全国性股份制银行 创新AI时代非结构化数据治理
AI时代下,银行所积累的数据量呈爆炸式增长,其中非结构化数据(如文本、图像、音频、视频等)占比日益提高,处理和分析难度也相应增大。因此,在商业银行数字化转型过程中,挖掘盘活差异化的数据策略已成为提升竞争力和业务创新的破局关键。打造更全面、精准的非结构化数据理解和表达能力,挖掘非结构化数据中的潜在价值,实现非结构化数据高效治理,对于商业银行优化业务流程、提升客户体验、增强风险管理能力,甚至对于当前银行业大模型布局,都具有重要意义。信雅达携手银行共同探索非结构化数据治理新方向,开辟商业银行差异化竞争新航道。
本案例中,银行方在全面拥抱数字化转型的背景下,制定以“深挖数据价值、内部数据互通、实现中台赋能”为目标的非结构化数据治理战略规划,通过建立全行统一的非结构化数据存储管理中台,实现非结构化数据的深入解析应用与全生命周期管理,盘活积存的非结构化数据“资产”,以此推动非结构化数据内容驱动业务赋能与创新。
谋定后动·非结构化数据治理体系建设
项目伊始,信雅达根据中后台分离的技术特点,为行方量身定制完整的非结构化数据治理体系,即:搭建全行非结构化数据处理中心,将智能化技术融入全类型非结构化识别处理环节,进一步挖掘数据价值;重构全行非结构化数据管理平台,提高数据利用能力。
通过项目的建设,信雅达助力银行方从优化非结构化数据采集和存储层面出发,构建起非结构化数据全生命周期管理体系,真正将海量的非结构化数据转化为支撑银行方业务发展的关键“资产”。
步步为营·非结构化数据全生命周期管理实践
✦ 全行非结构化数据处理中心
专注于非结构化数据的价值挖掘和高效利用,旨在通过智能技术与综合管理的深度融合,优化数据处理流程,提升数据应用效率。
■ 确立统一的数据接入标准,构建通用的非结构化数据标签体系,打破业务系统间的数据调用壁垒,实现跨系统、跨模型的数据检索与复用,从源头保障非结构化数据“资产”的复用能力。
■ 运用OCR、深度学习等技术实现非结构化数据的自动分类、打标及关键信息提取,同时建设“自动+人工”双重质检机制,提高数据处理效率的同时保证处理质量。通过这些智能化工具能够显著提高数据处理效率,降低人力成本,同时发现数据中的隐藏模式和关联,为银行方决策提供有力支持。
✦ 全行非结构化数据管理平台
作为全行非结构化数据处理最基础服务,支撑全行非结构化数据的统一存储及全生命周期管控。
■ 通过微服务架构设计,实现各业务模块的独立化运行,在接入上支持灵活的参数化管理,以减少业务系统接入成本,提高平台易用性和灵活性。
■ 平台支持对接国内外多类型存储系统,可根据接入系统制定差异化传输及存储归档策略,构建更科学的存储调配机制,实现非结构化数据的全生命周期管理。
■ 平台采用全栈信创建设,使用国产数据库和中间件。
聚沙成塔·非结构化数据治理成效初显
目前,银行方非结构化数据治理项目一期已经完成:通过沉淀标签数据,在提高数据检索效率的同时,也为数据分析和业务洞察提供更多视角;通过打通数据壁垒,在实现客户维度非结构化数据内部复用的同时,也简化业务流程,提升服务效率和客户体验;通过集成对接存储层的硬件,实现应用层与数据层的融合;实现为行内账户管理类业务的高效快捷办理提供强有力的支持,成效初显。
行稳致远·非结构化治理未来发展方向
1996年,信雅达在全国首推银行票据影像系统,一举开创国内银行票据文档影像数字化管理先河。这是信雅达留在我国金融IT发展史中最初的剪影。
28载风雨兼程,信雅达把产品当作品,不断做深、做精、做透。在这条超越自我的跑道上,从最初的影像系统,到自主研发的内容管理平台,再到近年来的全生命周期非结构化数据治理体系,以及当下行业聚焦的智能中台与多模态大模型,信雅达坚持新技术与金融业务的深度融合,持续领跑市场、创新而行。据工信部赛迪研究院赛迪顾问近年来发布的《中国银行业IT解决方案市场分析报告》显示,在非结构化数据管理解决方案市场上,信雅达多年稳居榜首。
尤其是在银行业加码布局大模型的当下,进一步挖掘利用非结构化数据治理以促进多模态大模型的形成,已成为银行业布局数据治理的关键战略步骤。对此,信雅达正探索基于AI多模态分析技术,整合结构化与非结构化数据,打造跨模态数据转换、跨模态数据同步与对齐、跨模态数据融合分析、语义理解等数据处理能力。
在实际方案建设中,信雅达将助力行方整合和标准化分散在不同业务系统的非结构化数据,对数据进行清洗和预处理,构建统一的数据视图;运用自然语言处理、图像识别和音频分析等技术提取关键特征,并利用这些特征训练深度学习模型;最终将训练成熟的模型部署于实际业务中,如风险评估和客户评级,并根据业务反馈进行不断调整与优化。
同时,考虑到现实数据通常以复合形式存在,单一模态的数据往往不足以捕捉事件的全貌,所以在非结构化数据治理的过程中,多模态大模型能显现出其独特且关键的价值。通过集成和分析来自不同源(如文本、图像、音频和视频)的数据,多模态大模型可有效提取和整合关键信息,实现复杂模式分析,识别跨模态内容的相关性。
从数据治理到“智”理,信雅达将帮助行方持续构建完整的非结构化数据治理体系,不断强化非结构化数据汇聚整合、内容提取、价值挖掘、灵活存储、安全管控、服务可视化等核心模块,加速探索数据融合与联合分析,推动行内原始数据向数据“资产”转化,并逐步实现以数据洞察驱动业务运营赋能业务的完善与创新。
目前,信雅达非结构化数据治理相关产品均已完成国产化适配工作,形成了从硬件到应用软件全平台信创覆盖的完整技术栈。信雅达致力于将客户信创要求与非结构化数据体系化治理深度融合,在提供符合信创标准的产品基础之上,积极结合当下主流的安全工具以及信创选型,构建一个安全、高效处理非结构化数据的生态系统。信雅达期待与更多银行伙伴携手,共同构建更全面、更高效的数据治理体系,让日益增多的非结构化数据不再是沉睡的宝藏,而是成为推动银行业务发展、服务创新和决策优化的关键驱动力。