数据治理:数据标准体系建设的重要性
随着信息社会的发展和大数据时代的来临,数据资产对企业发展的重要性不言而喻。然而,许多企业对数据资产的掌握程度仍旧停留在简单的数字化和数仓建设,手中的数据难以转化为数据资产,企业发展也因此裹足不前,只能眼睁睁看着“大数据”的东风越飘越远。
由此,越来越多的企业注意到了数据治理的重要性。数据治理是企业实现数字战略的基础,它不单单是一个治理项目,还是一套可落地、可持久发展的管理体系,包括组织、制度、流程、工具等。
在进行数据治理项目时,有一项工作是核心、是基础、是巨人迈出的第一步,那就是重构企业数据标准体系。
一、数据标准是什么?
《数据标准管理实践白皮书》中提到:数据标准是进行数据标准化的主要依据,构建一套完整的数据标准体系是开展数据标准管理工作的良好基础,有利于打通数据底层的互通性,提升数据的可用性。简述之,即数据标准(Data Standards)是指保障数据的内外部使用和交换的一致性和准确性的规范性约束。
对企业来说,数据标准就是企业数据的使用者、持有者和利益相关人员在数字化环境中的一种统一语言。数据标准为企业内部数据制定了一套统一的规范,包括数据的类型、长度、归属等。这样一来,企业内不同业务系统对数据的理解和使用就能达成统一。
二、数据标准重要在哪里?
自古以来,统一和标准化就被视为事物前进发展的前提和基础。古时候,秦始皇统一六国,一并统一了国家制度、货币、文字、度量衡;现如今,正是因为有了国际交流的统一语言,科技、文化、经济才得以交流和发展。在数据治理工作中,数据标准体系的构建就等同实现统一和标准化的伟大举措。数据标准体系是企业数据治理架构中的核心底层部分,是进行其它领域数据治理工作的基础。
数据标准体系通常也指数据环境,而数据的质量问题很大程度上取决于数据所处环境的状况。数据标准不仅仅是治理工作的通行证,还是数据质量的保护伞,可为业务运营和管理决策提供相应的支持保障。因此需要从根本上打造一整套全方位的数据标准体系以确保数据质量的可控制性、可持续性。
《数据标准管理实践白皮书》中进一步解释了数据标准的作用:
数据标准从多个方面支撑企业的数字化转型。在业务方面,数据标准能够明确很多业务含义,使得业务部门之间、业务和技术之间、统计指标之间统一认识与口径。在技术方面,数据标准能够帮助构建规范的物理数据模型,实现数据在跨系统间敏捷交互,减少数据清洗的工作量,便于数据融合分析。
数据标准是数据资产管理多个活动职能的核心要素,主要体现在数据质量管理、主数据管理、元数据管理、数据模型管理和数据安全管理几个方面。
在数据质量管理方面,数据标准是数据质量稽核规则的主要参考依据,通过将数据质量稽核规则与数据标准关联,一方面可以实现字段级的数据质量校验,另一方面也可以直接构建较为通用的数据质量稽核规则体系,确保规则的全面性和可用性;
在主数据管理方面,需明确的是主数据是数据在特定应用场景下的一种展现方式,主要活动是提取核心数据并明确核心数据的唯一来源,因此,对于涵盖企业全部数据的数据标准而言,其可以作为主数据管理的数据标准;
在元数据管理方面,当将元数据管理的对象定义为结构化数据时,元数据管理主要指对结构化数据及其相关信息的管理,数据标准作为结构化数据相关信息的一部分,也是元数据管理的内容,具体包括数据标准与结构化数据的关系映射(即落标的过程)。当将元数据管理的对象定义为数据标准体系时,元数据管理主要指对数据标准分类、数据项及其属性、数据项属性规则等的管理;
在数据模型管理方面,当数据标准的对象包含实体、属性和关系及其相关规则时,数据标准可作为数据模型管理的标准,用于数据库、数据仓库等系统的数据模型构建依据。就本白皮书所讨论的数据标准而言,数据标准体系可作为构建概念数据模型和逻辑数据模型的业务参考;
在数据安全管理方面,数据标准可包含业务敏感数据对象和属性,从而实现对数据安全管理相关规则的定义。包括数据分类及编码标准、数据模型标准、数据质量管理标准、数据安全管理标准、数据交换标准,对应落地平台应具备管理数据标准体系的过程和结果的功能。
三、关于数据标准体系构建的实践
企业内的数据可分为分析型数据(趋势、计划、指标数据等)、交易型数据、共享(主)数据、业务场景数据4大类(见图一)。
中翰软件立足于丰富的数据治理经验和对业务的深刻理解,打造了一套包括以上4大类型数据在内的全方位的数据标准体系,内容包括数据管理组织、制度,流程、考核机制,数据安全、质量管理体系,数据分类、编码体系,数据交换规范体系等(见图二)。
总结
构建数据标准体系是企业数据治理的基础,没有标准化,更加谈不上数据质量。前文提到,“数据治理是一套管理体系,包括组织、制度、流程、工具等”,而作为其基础工作的数据标准体系构建,同样也离不开组织架构、制度体系以及规划执行等实体落地工作。(山东中翰软件有限公司)