新闻热线:0531-87905608 投稿邮箱:cehsds@126.com

数据治理前,企业如何自查数据质量

1

导读:为适应时代发展脚步,更快更好获取市场资源,许多企业在完成信息系统搭建后,开始谋求数字化转型。然而,数据质量低下始终是企业合理运用数据的绊脚石。数字时代,数据已经变成一个企业的重要资产,而数据质量的高低则是决定这份资产价值几何的重要指标。只有妥善地解决数据质量问题,企业内的数据资产才能更好地发挥它的价值,实现收益最大化。

为了提升数据质量,实施数据治理几乎是企业的必选项。根据多年数据治理经验,中翰建议,企业在开展数据治理项目之前,应该先完成数据质量自查工作。

一、企业为什么需要自查数据质量

1.企业数据质量问题的成因较为复杂,任一环节出错,都会对数据质量产生影响。所以,需要借助专业的视角进行评判。对于企业数据质量问题,我们不仅应该对暴露在表面的数据本身的问题进行统计和分析,还应该从技术、业务、管理等层面,评估数据质量问题的深层次成因,以便彻底解决问题,避免重蹈覆辙,浪费人力、精力和财力。

2.企业数据现状的自查是未来开启数据治理的基础工作,是让领导下定决心的第一步。只有充分了解到企业数据质量问题的急迫性和严重程度,领导才能对数据治理工作的重要性产生相对正确的认知。有了领导的支持和推进,数据治理工作才能更加顺畅有序进行,数据治理成果也能得到一定保证。

3.只有充分、全面、深入评估了解企业数据质量的现状及成因,才能更好地对症下药。咨询方会将评估结果作为数据治理项目实施的重要参考,将技术手段与管理机制相结合,杜绝数据质量问题再次出现。

二、企业如何进行数据质量自查?

1.遵守数据质量自查标准

数据完整性:数据是否完整地描述某一业务实体对象的基准数据以及其被引用的关联属性数据信息。要注意数据是否丢失,或者有不可用的情况;注意关联的数据是否缺失,或者未建立索引。不完整数据的借鉴价值会大大降低,这也是数据质量问题中比较基础和常见的一类问题。

数据一致性:同一业务实体对象在不同业务系统、不同组织机构内,它的名称等相关静态基准信息,以及其被引用的关联属性数据信息应是否完全一样,不存在任何差异。

数据合规性:数据针对某一业务实体对象的描述是否完全符合业务规则、业务代码制定原则、数据描述规范。数据应按照统一格式存储,其内容、格式和展现形式,都必须符合数据定义和业务定义的要求,不能违反数据标准规范。

数据冗余针对同一业务实体,在企业内所有系统、组织机构中是否存在多个代码对应;针对同一代码,在企业不同业务管理过程中是否存在多个业务实体对应。重复冗余数据是导致业务无法协同、流程无法追溯的重要因素,也是数据治理需要解决的最基本的数据问题。

数据及时性:数据由产生到被使用的时间过程是否在企业规定范围内。尤其要关注那些对业务发展极为重要的关键性数据是否能够及时传递到目标位置。

数据有效性:数据生产者是否完全按照数据使用者的要求进行数据的新增、审核,生成的数据是否完全满足使用者对数据的要求。要关注数据和信息的内容是否正确,有没有无效数据、错误数据或超期数据等。真实有效的数据是企业管理工作的基础,是帮助企业进行正确决策的资料。

2.从数据自身的角度自查数据质量

遵守数据质量自查标准即可,见图一:

2

图一 自查数据质量的方法(数据角度)

3.从业务管理和数据应用分析的角度判断数据质量

3

4.数据自查具体步骤

1)明确目标,有针对性开展评估

评估的最终目标是为了使数据质量更好地满足业务的需求。所以首先应该明确业务对各类数据的各种要求,有针对性地对各类数据进行评估。

2)根据业务需求,确定评估细节

对于不同类别的数据,要根据当前的目标和需求选取不同的评估维度,设立不同的评估标准,对同一数据的不同生命周期也是如此。最终,可以根据各种细节确立一套合理高效的评估体系,归入日后的数据管理常规性工作中。

3)实施评估,合理选择方式方法

在实施评估的过程中,应该根据不同数据的特点,选择对应的测度,运用合理的方式方法,多维度结合考量,保证评估结果的准确性。

4)结果分析

作为数据治理项目实施的重要依据,在撰写数据质量评估报告时,应从企业的角度对评估结果进行合理分析,给出确定的结论和目标需求,有效指导后续的工作。

5.数据质量自查实例

【案例一】数据规范、标准问题:国内某大型箱包生产企业集团。

1)编码数据模型不统一、不标准,如表一所示:

4

分析:通过以上数据可以看出,不同编码的规格型号的描述方式相差较大,有纯汉字说明和借用编码流水号两种,二者的共存很容易导致一物多码或一码多物的问题发生,因为不一样的描述方法,业务系统无法验证新增数据时的重复所在。且物资描述不标准、不清晰,规格型号用编码来代替,新员工难以快速理解,容易导致错误采购、错误生产、错误盘点等现象的发生,对业务产生负面影响。

2)规格型号书写格式不规范,如表二所示:

5

分析:规格型号的描述中“织唛”前有的有空格,有的没有空格,这种现象的出现直接导致现有业务系统无法实现有效查重,出现重码现象在所难免。

【案例二】数据冗余问题:国内某大型装备制造企业集团。

企业的数据规范和标准长期由人工执行,以及数据新增时的人为查重、人为监管等,导致了主数据层面“一物多码”的大量存在,产生了大量的主数据冗余。

1)书写格式不规范,出现了大小写(同一小类)不统一的情况,如表三所示:

6

分析:表三的编码中,编码属性模板还是比较标准的,但是在实际录入过程中出现了大小写不一致的问题,如最后三条编码规格中用的是小写,往上三行是大写,再往上又有小写出现,这很明显地说明了缺乏严格的数据验证制度,所以编码重复在所难免。

2)很明显的数据冗余(同一小类内一物多码),如四所示:

7

(山东中翰软件有限公司)

发展改革·区域聚焦

山东省发展改革委发布民营经济高质量发展典型案例之临沂:以信用体系建设赋能民营经济高质量发展
大干快干见成效 坚定不移抓落实——德州市召开发改系统四季度重点工作推进会议
山东省发展改革委发布民营经济高质量发展典型案例之日照:强化科技支撑 引领民营企业创新发展
山东省发展改革委发布民营经济高质量发展典型案例之威海:惠企政策“直达快享” 民营企业焕发新活力
山东省发展改革委发布民营经济高质量发展典型案例之宁阳:创新优化服务生态 激发民营经济活力
泰安市发展改革委开展经贸领域中央支持项目现场督导
滨州市发展改革委召开党组扩大会议传达学习党的二十届四中全会精神
临沂市兰山区居民消费品价格总体平稳,蔬菜猪肉涨鸡蛋跌(10.20-10.27)

绿色能源

乡村振兴添“绿”翼 山东省能源行业“工会助力乡村振兴”劳动竞赛总结观摩交流活动圆满收关
山东临沭:践行绿色低碳发展理念,建设“红村绿电”智能微电网
山东能源行业:安全保供暖民生 双节守护不打烊
逐绿而行践初心 服务发展谱新章——山东省绿色低碳产业发展协会第一届理事会第一次会议成功召开
山东省发展改革委领导出席山东省绿色低碳产业发展协会理事会议
“中国绿证:畅行中国 走向世界”黄河流域绿证宣传推介会在济南举办
2025清洁能源大会暨核能安全与核电产业链创新发展大会圆满举行
以赛赋能,激发行业新活力——山东省能源行业“绿色能源杯”乒乓球羽毛球赛圆满落幕

齐鲁粮油

“粮食安全看山东”之菏泽:国有粮企有担当,粮食安全有保障
“粮食安全看山东”之菏泽:坚持依法管粮改革发展,夯实区域粮食安全根基
“粮食安全看山东”之元灏面粉:“硬核担当”推动全链条节粮减损
泰安市发展改革委开展秋粮收购督导
“粮食安全看山东”之三丰香油:芝麻飘香“好品山东”
“粮食安全看山东”之广饶:科技赋能筑牢粮食安全屏障
“粮食安全看山东”之广饶:“引凤筑巢”赋能粮食产业高质量发展
“粮食安全看山东”之东营市垦利区:四个“+”助力地方储备粮有效监管

价格调控·价格服务

淄博市10月份市场价格监测情况分析
山东沂源:受雨水低温影响,蔬菜价格大幅上涨
10月31日青岛市重要民生商品总体价格运行平稳
10月31日临沂水果价格稳定,蔬菜价格上涨
临沂商城周价格总指数为102.33点,环比上涨0.14点(10.23—10.29)
济宁:本周猪肉价格止跌回升,蔬菜价格小幅上涨(10.24--10.30)
滨州:蔬菜价格涨幅较大,鸡蛋、猪肉价格基本稳定
10月第五周德州市居民生活消费品价格呈现窄幅上涨走势

价格监测

发展视觉