新闻热线:0531-87905608 投稿邮箱:cehsds@126.com

数据治理前,企业如何自查数据质量

1

导读:为适应时代发展脚步,更快更好获取市场资源,许多企业在完成信息系统搭建后,开始谋求数字化转型。然而,数据质量低下始终是企业合理运用数据的绊脚石。数字时代,数据已经变成一个企业的重要资产,而数据质量的高低则是决定这份资产价值几何的重要指标。只有妥善地解决数据质量问题,企业内的数据资产才能更好地发挥它的价值,实现收益最大化。

为了提升数据质量,实施数据治理几乎是企业的必选项。根据多年数据治理经验,中翰建议,企业在开展数据治理项目之前,应该先完成数据质量自查工作。

一、企业为什么需要自查数据质量

1.企业数据质量问题的成因较为复杂,任一环节出错,都会对数据质量产生影响。所以,需要借助专业的视角进行评判。对于企业数据质量问题,我们不仅应该对暴露在表面的数据本身的问题进行统计和分析,还应该从技术、业务、管理等层面,评估数据质量问题的深层次成因,以便彻底解决问题,避免重蹈覆辙,浪费人力、精力和财力。

2.企业数据现状的自查是未来开启数据治理的基础工作,是让领导下定决心的第一步。只有充分了解到企业数据质量问题的急迫性和严重程度,领导才能对数据治理工作的重要性产生相对正确的认知。有了领导的支持和推进,数据治理工作才能更加顺畅有序进行,数据治理成果也能得到一定保证。

3.只有充分、全面、深入评估了解企业数据质量的现状及成因,才能更好地对症下药。咨询方会将评估结果作为数据治理项目实施的重要参考,将技术手段与管理机制相结合,杜绝数据质量问题再次出现。

二、企业如何进行数据质量自查?

1.遵守数据质量自查标准

数据完整性:数据是否完整地描述某一业务实体对象的基准数据以及其被引用的关联属性数据信息。要注意数据是否丢失,或者有不可用的情况;注意关联的数据是否缺失,或者未建立索引。不完整数据的借鉴价值会大大降低,这也是数据质量问题中比较基础和常见的一类问题。

数据一致性:同一业务实体对象在不同业务系统、不同组织机构内,它的名称等相关静态基准信息,以及其被引用的关联属性数据信息应是否完全一样,不存在任何差异。

数据合规性:数据针对某一业务实体对象的描述是否完全符合业务规则、业务代码制定原则、数据描述规范。数据应按照统一格式存储,其内容、格式和展现形式,都必须符合数据定义和业务定义的要求,不能违反数据标准规范。

数据冗余针对同一业务实体,在企业内所有系统、组织机构中是否存在多个代码对应;针对同一代码,在企业不同业务管理过程中是否存在多个业务实体对应。重复冗余数据是导致业务无法协同、流程无法追溯的重要因素,也是数据治理需要解决的最基本的数据问题。

数据及时性:数据由产生到被使用的时间过程是否在企业规定范围内。尤其要关注那些对业务发展极为重要的关键性数据是否能够及时传递到目标位置。

数据有效性:数据生产者是否完全按照数据使用者的要求进行数据的新增、审核,生成的数据是否完全满足使用者对数据的要求。要关注数据和信息的内容是否正确,有没有无效数据、错误数据或超期数据等。真实有效的数据是企业管理工作的基础,是帮助企业进行正确决策的资料。

2.从数据自身的角度自查数据质量

遵守数据质量自查标准即可,见图一:

2

图一 自查数据质量的方法(数据角度)

3.从业务管理和数据应用分析的角度判断数据质量

3

4.数据自查具体步骤

1)明确目标,有针对性开展评估

评估的最终目标是为了使数据质量更好地满足业务的需求。所以首先应该明确业务对各类数据的各种要求,有针对性地对各类数据进行评估。

2)根据业务需求,确定评估细节

对于不同类别的数据,要根据当前的目标和需求选取不同的评估维度,设立不同的评估标准,对同一数据的不同生命周期也是如此。最终,可以根据各种细节确立一套合理高效的评估体系,归入日后的数据管理常规性工作中。

3)实施评估,合理选择方式方法

在实施评估的过程中,应该根据不同数据的特点,选择对应的测度,运用合理的方式方法,多维度结合考量,保证评估结果的准确性。

4)结果分析

作为数据治理项目实施的重要依据,在撰写数据质量评估报告时,应从企业的角度对评估结果进行合理分析,给出确定的结论和目标需求,有效指导后续的工作。

5.数据质量自查实例

【案例一】数据规范、标准问题:国内某大型箱包生产企业集团。

1)编码数据模型不统一、不标准,如表一所示:

4

分析:通过以上数据可以看出,不同编码的规格型号的描述方式相差较大,有纯汉字说明和借用编码流水号两种,二者的共存很容易导致一物多码或一码多物的问题发生,因为不一样的描述方法,业务系统无法验证新增数据时的重复所在。且物资描述不标准、不清晰,规格型号用编码来代替,新员工难以快速理解,容易导致错误采购、错误生产、错误盘点等现象的发生,对业务产生负面影响。

2)规格型号书写格式不规范,如表二所示:

5

分析:规格型号的描述中“织唛”前有的有空格,有的没有空格,这种现象的出现直接导致现有业务系统无法实现有效查重,出现重码现象在所难免。

【案例二】数据冗余问题:国内某大型装备制造企业集团。

企业的数据规范和标准长期由人工执行,以及数据新增时的人为查重、人为监管等,导致了主数据层面“一物多码”的大量存在,产生了大量的主数据冗余。

1)书写格式不规范,出现了大小写(同一小类)不统一的情况,如表三所示:

6

分析:表三的编码中,编码属性模板还是比较标准的,但是在实际录入过程中出现了大小写不一致的问题,如最后三条编码规格中用的是小写,往上三行是大写,再往上又有小写出现,这很明显地说明了缺乏严格的数据验证制度,所以编码重复在所难免。

2)很明显的数据冗余(同一小类内一物多码),如四所示:

7

(山东中翰软件有限公司)

发展改革·区域聚焦

泰安:集群阵营再扩大,新增2个雁阵形和2个支柱型雁阵集群
济南市发展改革委召开市绿色低碳高质量发展先行区建设领导小组办公室会议
潍坊·南木林对口支援工作联席会暨“潍坊企业家日喀则行”座谈会顺利召开
首批20个“滨州场景机会清单”发布
山东肥城市老城街道达成泰安市首单水土保持生态产品价值转化交易
泰安:新型工业化强市建设赢得三笔财富
山东省发展改革委区域处、开放处、经贸处、城镇化处、驻委纪检监察组党支部开展联合主题党日活动
抓项目优环境稳增长 山东郓城县域经济发展迈上新台阶

绿色能源

2025清洁能源大会暨核能安全与核电产业链创新发展大会圆满举行
以赛赋能,激发行业新活力——山东省能源行业“绿色能源杯”乒乓球羽毛球赛圆满落幕
“放开两头、管住中间”山东进一步深化天然气体制机制改革
山东省绿色低碳产业发展协会:“绿色低碳转型”专题调研走进潍坊
聚焦区域协同与低碳转型,共绘锂电循环新蓝图——2025华东动力电池回收产业区域大会在济成功举办
山东省能源局赴泰安市调研新能源产业发展情况
德州市唯一!庆云县锂钠电新能源产业集群入选第二批山东省数字产业集群
国家电投山东公司:“陇电入鲁”330千伏瑞启变并网投运

齐鲁粮油

济南市在第七届全省粮食行业技能竞赛中喜获佳绩
擂台竞技展风采 匠心聚力护粮安——第七届山东省粮食行业职业技能竞赛成功举办
“绿色优储”守好“齐鲁粮仓” 山东省粮食和物资储备局举办政府开放日活动
粮食产业工业总产值超2300亿元,现有百亿企业10家——上半年山东省粮食和物资储备工作取得显著成效
“山东煎饼”进京“赶大集” ——山东煎饼亮相全国最大农副产品批发市场
山东农发行累计发放信用保证基金模式下贷款183亿元,支持收购粮食650万吨
山东省粮食收购贷款信用保证基金:首期成效显著,二期正式启动
山东省粮食收购贷款信用保证基金力保农民“粮出手、钱到手”

价格调控·价格服务

9月17日青岛市重要民生商品价格监测日报告
济宁:9月上旬猪肉价格震荡走低,鸡蛋价格止跌回升
近期淄博市生猪和猪肉价格呈弱势运行态势
山东省价格认证中心赴枣庄市开展涉纪检监察价格认定工作调研
9月15日青岛市重要民生商品价格监测日报告
菏泽:粮油肉类价格基本稳定,蔬菜价格总体平稳运行(9月4日—9月11日)
淄博价格指数解读(9—12)
9月第2周德州市居民生活消费品价格呈现稳中略涨走势

价格监测

发展视觉