无忧支付网首页
站内搜索
您当前的位置:主页 > 相关文档 >

支付清算数据治理的途径探析

添加时间:2022-09-20

  一、引言

  2018年中国国际大数据博览会顺利召开,习近平总书记在给其的贺信中提到,要掌握好大数据发展的重要时机,推动产业高速全面发展,协调好数据安全性、网络空间治理等方面的关系。这充分体现出当前大数据的战略地位。

  改革开放以来,我国经济快速发展,金融体制深化改革,信息科学技术迅猛发展,积累了大量金融数据。金融数据在近年来呈现出几何倍数的增长,并且已经由传统的数据类型发展到图片、视频、日志等半结构化和非结构化数据,信用数据、银行数据、征信数据、证券数据等都实现了井喷式的爆发,金融数据展现出极大的应用潜力和价值潜力。

  数据治理是大数据的重要组成部分,是提升数据质量和安全性的基础。虽然之前也研究过如何正确合理使用这些数据,但是如何从组织架构、原则和过程规则等方面对这些数据资源以规范的方式来管理,以确保数据管理的各项职能正确履行还缺乏相关研究。金融数据治理研究有利于形成科学治理体系,让数据展现出更高的价值,为金融决策提供数据支持,提升金融管理效率。

  支付清算数据是金融数据的一个组成部分,本文以支付清算数据治理为例,采用多种研究方法,对数据治理包含的三个关键活动即评估、指导、监督进行展开,充分实现促进支付清算数据服务创新和价值创造,提升支付清算数据管理和决策水平,有效利用数据治理产生高质量数据、增强数据可信性。

  二、数据治理概述

  数据治理是确保数据管理质量处于规范范围内,严格将严密性和纪律性贯穿到企业数据的管理、使用、优化和保护过程中。

  数据治理的概念可以解读为:为了使数据管理始终处于合规可控、实用有效的范围内,发挥其应有的价值,制定一系列相关的政策,以保证数据资产得到最大化利用。

  当前介绍大数据治理概念的文献还较少。索雷斯认为大数据治理是制定关于数据的优化升级、保密和变现的政策,属于广义信息治理的一部分。张绍华等对大数据治理有不同的理解,区别于大数据治理仅为对数据进行使用的概念,他们认为是对大数据管理和利用的效果进行评估、指导和监督,是一种后期管理的概念。

  Malik认为大数据治理包含了数据的使用、优化、保密、指导、监督的整个过程,涉及了政策、规则、权利、组织结构、个体的责任和信息系统,这些与数据处理过程有关的步骤都会对企业业务目标的实现产生影响。梁芷铭则拓宽了大数据治理的使用者范围,认为大数据治理不仅限于企业,还包括一切搜集、使用、监督大数据的部门、机构和组织。

  常见的数据治理模型有4种。一是ISACA数据治理模型,模型采用上层制定设计政策目标,下层逐步实施的结构,以简洁明了的形式展示出模型的可操作性,不同组织使用只需在部分地方进行治理。

  二是HESA数据治理模型,HESA认为数据治理模型不能单独存在,必须依赖于组织,这就要求数据治理需要和组织的设计架构保持一致性,同时又指出了各个组织有其自身不同的特点,应该根据其特征在通用模型的基础上进行修改。

  三是Mustimuhw Information Solutions数据治理模型,以螺旋形式表现出治理理念,用来反映治理过程的动态变化。

  四是Information Builders数据治理简易模型,展现了数据治理的整体流程,描述了数据治理的步骤,清晰明了。

  另外,CMMI协会早在2014年就发布了数据治理能力成熟度模型DMM。该模型从CMMI模型的基础上发展而来,其主要内容是搭建一个具有普适性的结构性框架,让不同组织根据其具体需要建立不同的成熟度模型,并根据构建的模型来评价该组织的数据治理能力。

  国外数据治理起始于2004年的企业管理,多是案例分析,集中在某个领域或者某个企业,仅是研究单个行业或企业的数据治理情况。例如,在第五届欧洲信息管理与评估会议中,专家针对中小企业提出了有关数据治理方面的问题,综合各个企业的看法后,在此基础上进一步研究了数据治理政策是否同样适用于中小企业。

  调查结果表明,虽然现在确实拥有一些具有适应性、可修改的模型,然而在实际操作中仍存在困难,中小企业仍旧处于数据治理的尾端。显然,随着大数据时代的到来,数据治理却仍然只服务于一小部分企业,缺乏普适性。构建具有可操作性和普适性的数据模型是必要的,值得引起广泛关注。

  国内数据治理集中在特定的领域,例如计算机软件科学、行政学以及银行金融等行业。我国银行业信息化走在前列,目前已经具有相对完善的信息系统,通过大量的客户基础和形式多样的金融产品创造了类型丰富、体量极大的数据,应运而生的数据治理也在银行业进一步发展的道路上发挥了重要作用。

  2018年5月21日,银保监会发布《银行业金融机构数据治理指引》,对银行、金融机构数据治理的原则理念、数据治理架构等的监管、规范做出了规定。学者们经过对银行的数据问题进行研究分析,发现了银行数据治理体系是一个上小下大的三角结构,依次为战略、机制、领域、技术支撑。

  中国农业发展银行建立了数据治理模型,最上层的战略层由行长为核心组成,而下层数据治理由业务部门主导,IT部门执行,同时还引入了质量监督考核体系。

  三、数据治理框架

  我们借鉴现有数据治理理论和经验,构建了数据治理的框架,包括3个体系,3个层面,1个平台。

  三个体系分别是数据治理的保障体系、数据管理体系和数据安全体系。建立独立完整的数据治理框架,明确规定框架内部的各层级人员和对应职责,制定数据治理战略、规范和细则,构建监督评估机制,通过建章立制为数据治理提供组织保障,确保各项工作有人来管,有章可循,有效可查。

  数据安全体系主要通过对数据全生命周期的管理,采用稳固的安全保障技术,构建完备的数据管理制度,来夯实安全基石。

  数据管理体系的三个层面分别为数据治理基础层、数据加工层和价值体现层。其中治理基础层主要完成数据标准定义与管理、元数据管理,以及有可能涉及到的主数据管理、数据模型等;数据加工层是数据的主要操作层,通过数据采集、数据汇集、数据清洗、深度加工等提升数据质量,并进行数据质量控制;价值体现层在前面工作的基础上,进一步释放数据价值创造与价值分享的能力。

  数据治理框架具体内容及相互关系如图1所示:

数据治理框架

图1 数据治理框架

  一个平台是构建一个智能的数据治理与分析平台。为更好管理数据治理活动,开展数据治理工作,我们开发建设了数据治理平台。该平台能够管理元数据、主数据、数据质量等。通过信息手段将有关规划、制度、规范和标准、流程等功能实现,推动数据治理流程固化、量化、标准化。

  数据治理的最终目的,是实现数据的价值。也就是在具体应用场景中,将繁杂无序的数据转化为条理清晰,可通过灵活的选项筛选出直观的、有实际意义和参考价值的应用数据。

  通过分析平台的多维分析功能,对治理后的数据开展多角度观察研究,将多个维度的数据组织在一起,通过对其重新进行片状、块状、糅合、取样、旋转等手段剖析,从多维度、多角度、多形式观察数据,更加深入了解数据中蕴含的信息。最终形成丰富、直观的报表、图表。

  支付清算数据可以在很多工作中发挥价值,例如:区域经济分析、行业发展分析、宏观经济预测、异常情况监测等,使用场景丰富。

  四、数据治理实践

  按照数据治理框架,我们从数据治理保障、数据管理和数据安全三个不同的角度开展数据治理活动,从组织保障、技术手段、安全保障三个方面提升数据治理的水平和能力。

  (一)数据治理保障体系

  1. 数据治理实施原则

  数据治理应该具有全覆盖性、匹配性、持续性、有效性原则。

  (1)全覆盖性原则:完整的数据治理政策应该达到全覆盖的目标,包括数据生命周期、业务数据使用、数据风险测量管理、使用流程全方位控制、内外部数据统一管理等。需要站在整体视角统筹数据治理工作,建立全局的数据治理指导规范,做到制度自上而下落实。

  (2)匹配性原则:应当建立与自身业务特点相适应的数据治理模式,使之与内部管理政策、业务规模大小、风险情况等相匹配,并在有变化时做出相应的调整。

  (3)持续性原则:数据治理不是一蹴而就的短期项目,最终目的是提升清算系统数据应用水平,及时发现数据治理存在的问题,进行风险管控,需要建立长效机制。

  (4)有效性原则:数据治理应促进数据的真实准确性,从而客观反映出清算系统真实情况,并且可以在经营管理中使用。

  2. 数据治理实施路径

  (1)构建科学清晰的数据治理组织体系:这是做好数据治理的第一步,数据治理组织架构包括管理组织、管理规范和监督评估机制三个方面。基于数据治理战略,逐步建立完善的数据治理制度和细则。

  (2)制定统一规范的数据标准评估系统:数据必须符合制定的统一规范准则,做好元数据管理是统一数据标准体系的基础。

  (3)设计完整高效的数据治理流程:数据治理流程可分为规划、治理实施和评估优化三个阶段。规划阶段:首先要评估数据管理和应用现状,明确数据治理具体目标,分析内外部环境和促成因素。治理实施阶段:考虑治理对象,主要涉及到战略、组织、架构等。评估优化阶段:需要基于数据治理成熟度评估模型,及时监督评估,持续改进优化。

  (4)实施持续优化的数据质量管理:包括对数据本身的质量管理和数据访问过程的质量管理。

  (5)形成创新深入的数据应用能力:数据治理是一项长期工作,治理效果的展现主要体现在数据应用能力上。

  (6)夯实稳定可靠的安全保障基础:注意敏感数据和隐私数据的权限开放,避免恶意盗取数据。

  3. 数据治理过程管理

  数据治理是一项长时间的持续工作,除了最初制定的政策,还另需一套科学严谨的流程,以保证数据治理活动顺利高效运行。数据治理实施过程如图2所示。

  (1)识别机遇:数据治理是一个长期性、不间断的过程,面对大量的信息资源,寻求恰当的时机,根据数据治理政策,找到相应的解决方法。

数据治理实施过程

图2 数据治理实施过程

  (2)现状评估:包括对外调研、内部调研和自我评价三个方面。首先是对外调研,就是根据目标,搜集国内国外文献,了解大数据的发展历程,学习最前沿的研究成果,了解行业内主要龙头企业的发展现状,对自身的大数据建设有一个初步的印象;

  其次,开展内部调研,包括与数据治理有关的管理层、业务部门、科技部门等;

  最后,进行自我评价,在对内外部情况有了一定的了解后,充分剖析自己的技术水平、人员管理情况等。在以上准备的基础上进行研究分析,对下一步的政策制定提供帮助。

  (3)制定阶段目标:这是大数据治理的核心步骤,它给出了大数据治理的组织方向。大数据治理的阶段目标根据不同企业的具体要求没有统一的标准,但是存在一些必须遵守的要求:一是简洁全面,能够简单清楚地说明问题,又能统筹不同使用者的需求;二是清楚明晰,明确清楚地给出所有相关者的目标和要求;三是可操作,给出的目标具有可达到性。

  (4)制定大数据治理实施方案:为了顺利实施数据治理政策,需要制定相应的方案规范执行过程,包括执行流程、使用范围、成果展示、时间节点管制等。制定方案本质上是为了提供一个在实施政策时的指南,帮助政策顺利施行。

  (5)执行大数据治理实施方案:执行阶段就是按照上一步骤制定好的方案按部就班地执行,具体实施大数据治理,包括搭建平台、规范流程、权责到人、权责分明。

  (6)运行与测量:建设一支专门作用于制度实施效果和绩效测量的团队,通过制定一系列与之相关的考核标准、评价体系、奖惩措施来监管、协调各部门的工作,从而使得大数据制度能更好地实施,保障数据安全、有价值地使用。例如,部分企业将数据使用、数据安全管理等列入到考核体系中,让各部门人员在意识上更加重视大数据治理,推动数据治理的发展。

  (7)监控与评估:在对数据治理运行情况进行监控管理,评估数据治理的成熟度。

  (8)大数据治理的例行活动:这一步骤是将大数据治理运用到实际工作中,包括数据治理标准、元数据管理的标准规范的完善和修订工作。在实际运用中找到这一治理政策的优缺点,便于下一步骤的改进优化。

  (9)大数据治理的持续改进:这是一个长期性、持续性的行为,是保障大数据战略成功的基石。在实际运用中发现政策上的一些问题后,及时修改以保证政策的准确性。面对不断出现的新问题,不断修改提升以保证政策的完整性。以此确保大数据治理工作的成功。

  (二)数据管理体系

  数据管理是数据治理过程中的核心内容,涉及到数据从产生、使用、维护到报废的整个数据生命周期全过程,直接影响到数据治理的成败。通过对国内外数据管理的相关理论框架进行研究,同时参考其他行业已经建立起的有价值的数据管理流程,结合实际情况,我们建立了数据管理体系,包括元数据管理、数据标准管理、数据质量管理、数据生命周期管理四大部分。

  1. 元数据管理

  元数据是数据的数据,即对数据的描述。元数据描述了数据的结构、内容等多项内容,提供了对数据对象的描述、定位、管理、检索、评估、选择和交互等功能,是数据质量的重要基础。元数据是数据对象的信息地图,通过元数据管理,能够准确勾勒出数据资产的整体视图,支持科学地制定信息数据管理政策。

  通过元数据管理,也能够建立统一的数据表达形式、元数据标准,使数据可视化,方便数据的灵活交互和扩展。

  为确保整个治理体系的稳定和持续,减少元数据变更造成的不利影响,元数据的制定应该采用前瞻性与普适性原则,也就是元数据一旦制定,尽量不要反复修改。所以制定元数据时原则上采用最新的国家标准与行业标准,这些标准具有权威性与稳定性。

  在具体定义元数据时,我们结合支付清算数据特点和后期需要涉及到的清算资金交易业务、清算信息类业务、系统类管理、经济行业动态、产业(集团)资金动态、企业交易行为等分析场景,这些元数据的制定能够有效实现对主数据、业务数据的统一管理。

  2. 数据标准管理

  数据标准的建立是单位信息化、数字化建设的一项重要工作,行业的各类数据必须遵循一个统一的标准进行组织,才能构成一个可流通、可共享的信息平台。

  对于支付系统大数据平台而言,数据的标准化以及标准化过程中的治理非常重要。做好数据标准,首先需要制定从标准制定、使用至废止的完整流程,严格按照流程执行。其次是在新系统建设时就要按照统一标准设计,避免边治理边出现新问题。再者要有配套的系统工具,以支持数据标准的有力落地。

  结合支付清算数据治理的具体要求,我们建立了如下数据标准:一是建立数据入库标准;二是主数据关键字段标准化。它主要有以下益处:第一,统一的数据标准可以提升业务效率。第二,统一的标准促进了数据共享。数据标准统一了各类系统的数据定义,降低了系统间集成的复杂度,提高了系统间交互效率,并为管理分析类系统提供了一致的分析指标和分析维度定义。

  第三,统一的数据标准提升了数据质量。数据标准明确了数据填写及数据处理的相关要求,规范了数据源的格式,同时提供了管控方面的保障,因此数据标准将直接提升大数据平台的数据质量。

  3. 数据质量管理

  支付清算数据的加工处理主要是三个过程。首先进行数据的导入,实现从原始数据到数据仓库的加载。之后进行必要的数据清洗,解决原始数据中存在的各种瑕疵,改善数据质量。在数据清洗这一步骤中,企业名称清洗是大数据平台数据治理的重点和难点,企业名称的数据质量直接关系数据治理的成效,因此我们对企业名称进行了三次清洗,有问题的数据总量下降到了10%左右。

  这部分企业大多数规模很小,其资金交易量加起来只占整个支付交易资金交易量的0.01%~0.02%,从大数据的角度是可以忽略不计。至此,数据质量治理的成效显而易见。最后进行数据加工,加上后期统计分析需要的信息,地区信息、行业信息、行别信息等等,便于后期数据分析使用。

  4. 数据生命周期管理

  数据生命周期管理是对不同类型的数据进行贯穿其整个生命周期的管理,通过完整的数据生命周期管理解决方案,让不同数据存放在适合的存储设备上,利用适当技术手段对这些数据进行处理和分析。这样,用户就可以提高现有存储设备的利用率,利用自动化的数据管理技术实现自动的数据管理,减少信息技术管理成本。

  任何事物都具有一定的生命周期,数据也不例外。从数据的产生、加工、使用乃至消亡都应该有一个科学的管理办法,将极少或者不再使用的数据从系统中剥离出来,并通过另外的存储设备进行保留,不仅能够提高系统的运行效率,还能大幅度减少因为数据长期保存带来的储存成本。

  数据生命周期一般包含在线阶段、归档阶段(有时还会进一步划分为在线归档阶段和离线归档阶段)、销毁阶段三大阶段,如图3所示。管理内容包括建立合理的数据类别,针对不同类别的数据制定各个阶段的保留时间、存储介质、清理规则和方式、注意事项等。

  从下图数据生命周期中各参数间的关系中我们可以了解到,数据生命周期管理可以使得高价值数据的查询效率大幅提升,而且高价格的存储介质的采购量也可以减少很多;但是随着数据的使用程度的下降,数据被逐渐归档,查询时间也慢慢的变长;最后随着数据的使用频率和价值基本没有了之后,就可以逐渐销毁了。

数据生命周期各阶段图

图3 数据生命周期各阶段图

  大数据平台的数据从入库就开始进行生命周期管理,通过清洗之后,数据就正式供用户进行查询,系统会记录下用户每次查询信息,其中包含了查询数据的时间信息,通过一段时间的实际使用,我们可以初步判断出近1年内的数据查询频率最高,1年以上到5年内的数据查询频率中等,5年以上的数据查询频率低。

  因此我们将近两年内的数据储存在高性能的存储设备之中,保证数据的高响应度以及高可用性。而将2年以上5年以下的数据存储在中等性能的存储设备之中。最后将5年以上数据储存在低性能的存储设备之中。参考会计准则规定,大数据平台的数据的保存期限可以设定为20年,对于超过保存期限的数据应当进行妥善的销毁处理。

  (三)数据安全体系

  数据安全是指确保数据的保密性、完整性和可用性。金融数据保存使用过程中,对数据安全有非常高的要求。数据安全体系主要解决的就是数据在保存、使用和交换过程中的安全问题。

  1. 做好数据分级分类和制度建设

  数据按照重要性、敏感性进行分级,敏感等级不同的数据对内使用时受到的保护策略不同,对外共享开放的程度也不同。在满足合规需求、满足内部使用需求的前提下,做好分类分级。可以从梳理敏感数据域、元数据归属数据域、隐形敏感数据的识别、制定数据类别、制定敏感等级这六个方面考虑给数据归类归级。

  为进一步加强和规范支付系统交易数据管理,保障交易数据安全,提高数据分析利用水平,我们参考国家、人民银行有关规章制度,制定了数据管理办法,为妥善使用数据打下了坚实的基础。

  2. 加强数据隐私保护

  数据隐私或信息隐私,是数据收集和传播之间的关系,涉及到技术、公众隐私预期、法律和政治等相关领域。数据隐私问题存在于个人、企业身份信息或其他敏感信息被收集、存储、使用及最终销毁后删除的各个环节。支付清算数据中包含有个人、企业的隐私信息,假如数据泄露,很可能对当事人的权益造成损害。如何在进行支付清算数据应用的过程中,做好数据隐私保护工作,是数据治理的关键环节。

  数据隐私问题的解决途径主要包括法规制度约束、技术改革保护以及规范管理流程这三方面。近年来,我国数据安全的有关法律法规、标准规范密集出台,先后颁布了《中华人民共和国网络安全法》《个人信息安全规范》(GB/T 35273-2020)《个人信息去标识化指南》(GBT 37964-2019)等,并且正在加紧制定《数据安全法》《数据安全管理办法》等法律法规。

  目前虽然还没有专门的隐私保护法,但是在多个法律条文中已经对保护企业、个人隐私做出了原则性的规定。我们在合规性的前提下,综合技术和管理两方面手段,加强数据隐私保护:

  (1)技术方面,对数据进行去标识化处理。选择恰当的去标识化方法;对去标识化过程中形成的辅助信息(如密钥,映射表等)采取有效的安全防护措施等。去标识化的过程尽量前置,从而对后续数据生命周期实现覆盖,从技术手段上为隐私信息提供安全保障。确实需要对外提供的个别数据,通过匿名化手段,对敏感信息字段进行不可逆处理。

  (2)管理方面,建立了数据展示与发布管理流程。明确数据管理责任。制定统一的流程,对数据的展示和发布进行管理,明确需要纳入统一管理的数据范围,明确数据发布的主管人员,在数据发布前向主管领导进行报备,主管领导负责审查发布的数据是否涉及金融消费者隐私。

  3. 强化数据访问控制

  (1)强化保密管理,与涉及到的系统操作人员签订保密协议,确保相关数据不会泄露给无权限的内外部人员,同时强化对相关人员的安全保密意识教育。指定专人负责支付清算数据的采集、传递、分析工作。

  (2)加强大数据平台安全防护。做好大数据平台及服务商的可靠性及安全性评测、应用安全评测;落实信息安全等级保护、风险评估等网络安全制度,保障网络安全;定期分析检查,第一时间发现处理非法入侵、异常用户访问等可疑情况。

  (3)做好数据权限管理设计。一是在系统设计中对于数据的展示做好权限管理规划,如内外部可见性、不同层级可见性、不同部门可见性、不同角色可见性、数据分析部门的特殊权限及安全控制,使得不同的人员可见的数据不同。

  二是以自身岗位职责和工作内容为基点,给员工设定登录系统、数据查询、数据采集、数据分析和数据下载等不同的权限。对于涉及重要隐私的数据,必须双人登录查询或是授权查询,同时严格把控用户数据下载的权限。

  三是引入操作留痕技术,通过日志审计功能,把系统用户进行过的查询和下载记录以日志的形式完整的保存下来,发现异常情况,可以凭借其痕迹快速定位相关人员。

  五、政策建议

  数据治理是一个长期、持续性的工作,最终目的是充分发挥数据价值。数据控制者应高度重视并在实践中不断检验和改进数据治理工作。

  一是做好顶层设计,有序开展系统治理。

  数据治理需要做好顶层设计,由上至下开展。建议从上至下建立统一的管理措施,上层管理者组织开展数据治理,提前做好系统建设规划。数据操作员、使用者加强元数据、主数据、业务数据的管理和使用,从而不断提升数据治理治理能力。

  二是加强数据资源共享合作。

  为了更好支持金融数据促进经济发展,发挥支付系统数据价值,金融机构首先应该在内部加强交流合作,实现数据资源的共享。在相对可控的环境内,进一步探索数据的联合使用。同时在确保安全的前提下,加强与外部机构的合作共享,银行机构、大数据局、证券公司等都可以进行数据的交流合作,进一步提升金融数据治理能力,发挥金融数据的价值。

  三是构建完整的资金交易数据中心。

  建议由中央银行牵头建立资金交易数据中心,统一存储管理所有资金交易数据,构建完整的资金流量链条。数据中心可根据金融监管需要,采用机器学习、人工智能等先进技术,对资金交易数据开展分析,勾画出资金流动网,使一切资金流转行为都置于合规监管之内。

关闭

1.点击下面按钮复制微信号

***********

2.打开微信→查找微信号

加为好友 开始支付接入