新闻热线:010-63691890 投稿邮箱:cehsds@126.com

数据治理前,企业如何自查数据质量

1

导读:为适应时代发展脚步,更快更好获取市场资源,许多企业在完成信息系统搭建后,开始谋求数字化转型。然而,数据质量低下始终是企业合理运用数据的绊脚石。数字时代,数据已经变成一个企业的重要资产,而数据质量的高低则是决定这份资产价值几何的重要指标。只有妥善地解决数据质量问题,企业内的数据资产才能更好地发挥它的价值,实现收益最大化。

为了提升数据质量,实施数据治理几乎是企业的必选项。根据多年数据治理经验,中翰建议,企业在开展数据治理项目之前,应该先完成数据质量自查工作。

一、企业为什么需要自查数据质量

1.企业数据质量问题的成因较为复杂,任一环节出错,都会对数据质量产生影响。所以,需要借助专业的视角进行评判。对于企业数据质量问题,我们不仅应该对暴露在表面的数据本身的问题进行统计和分析,还应该从技术、业务、管理等层面,评估数据质量问题的深层次成因,以便彻底解决问题,避免重蹈覆辙,浪费人力、精力和财力。

2.企业数据现状的自查是未来开启数据治理的基础工作,是让领导下定决心的第一步。只有充分了解到企业数据质量问题的急迫性和严重程度,领导才能对数据治理工作的重要性产生相对正确的认知。有了领导的支持和推进,数据治理工作才能更加顺畅有序进行,数据治理成果也能得到一定保证。

3.只有充分、全面、深入评估了解企业数据质量的现状及成因,才能更好地对症下药。咨询方会将评估结果作为数据治理项目实施的重要参考,将技术手段与管理机制相结合,杜绝数据质量问题再次出现。

二、企业如何进行数据质量自查?

1.遵守数据质量自查标准

数据完整性:数据是否完整地描述某一业务实体对象的基准数据以及其被引用的关联属性数据信息。要注意数据是否丢失,或者有不可用的情况;注意关联的数据是否缺失,或者未建立索引。不完整数据的借鉴价值会大大降低,这也是数据质量问题中比较基础和常见的一类问题。

数据一致性:同一业务实体对象在不同业务系统、不同组织机构内,它的名称等相关静态基准信息,以及其被引用的关联属性数据信息应是否完全一样,不存在任何差异。

数据合规性:数据针对某一业务实体对象的描述是否完全符合业务规则、业务代码制定原则、数据描述规范。数据应按照统一格式存储,其内容、格式和展现形式,都必须符合数据定义和业务定义的要求,不能违反数据标准规范。

数据冗余针对同一业务实体,在企业内所有系统、组织机构中是否存在多个代码对应;针对同一代码,在企业不同业务管理过程中是否存在多个业务实体对应。重复冗余数据是导致业务无法协同、流程无法追溯的重要因素,也是数据治理需要解决的最基本的数据问题。

数据及时性:数据由产生到被使用的时间过程是否在企业规定范围内。尤其要关注那些对业务发展极为重要的关键性数据是否能够及时传递到目标位置。

数据有效性:数据生产者是否完全按照数据使用者的要求进行数据的新增、审核,生成的数据是否完全满足使用者对数据的要求。要关注数据和信息的内容是否正确,有没有无效数据、错误数据或超期数据等。真实有效的数据是企业管理工作的基础,是帮助企业进行正确决策的资料。

2.从数据自身的角度自查数据质量

遵守数据质量自查标准即可,见图一:

2

图一 自查数据质量的方法(数据角度)

3.从业务管理和数据应用分析的角度判断数据质量

3

4.数据自查具体步骤

1)明确目标,有针对性开展评估

评估的最终目标是为了使数据质量更好地满足业务的需求。所以首先应该明确业务对各类数据的各种要求,有针对性地对各类数据进行评估。

2)根据业务需求,确定评估细节

对于不同类别的数据,要根据当前的目标和需求选取不同的评估维度,设立不同的评估标准,对同一数据的不同生命周期也是如此。最终,可以根据各种细节确立一套合理高效的评估体系,归入日后的数据管理常规性工作中。

3)实施评估,合理选择方式方法

在实施评估的过程中,应该根据不同数据的特点,选择对应的测度,运用合理的方式方法,多维度结合考量,保证评估结果的准确性。

4)结果分析

作为数据治理项目实施的重要依据,在撰写数据质量评估报告时,应从企业的角度对评估结果进行合理分析,给出确定的结论和目标需求,有效指导后续的工作。

5.数据质量自查实例

【案例一】数据规范、标准问题:国内某大型箱包生产企业集团。

1)编码数据模型不统一、不标准,如表一所示:

4

分析:通过以上数据可以看出,不同编码的规格型号的描述方式相差较大,有纯汉字说明和借用编码流水号两种,二者的共存很容易导致一物多码或一码多物的问题发生,因为不一样的描述方法,业务系统无法验证新增数据时的重复所在。且物资描述不标准、不清晰,规格型号用编码来代替,新员工难以快速理解,容易导致错误采购、错误生产、错误盘点等现象的发生,对业务产生负面影响。

2)规格型号书写格式不规范,如表二所示:

5

分析:规格型号的描述中“织唛”前有的有空格,有的没有空格,这种现象的出现直接导致现有业务系统无法实现有效查重,出现重码现象在所难免。

【案例二】数据冗余问题:国内某大型装备制造企业集团。

企业的数据规范和标准长期由人工执行,以及数据新增时的人为查重、人为监管等,导致了主数据层面“一物多码”的大量存在,产生了大量的主数据冗余。

1)书写格式不规范,出现了大小写(同一小类)不统一的情况,如表三所示:

6

分析:表三的编码中,编码属性模板还是比较标准的,但是在实际录入过程中出现了大小写不一致的问题,如最后三条编码规格中用的是小写,往上三行是大写,再往上又有小写出现,这很明显地说明了缺乏严格的数据验证制度,所以编码重复在所难免。

2)很明显的数据冗余(同一小类内一物多码),如四所示:

7

(山东中翰软件有限公司)

发展改革·区域聚焦

济宁印发2025年国民经济和社会发展计划,明确经济社会发展预期目标和重点任务
山东推出28条具体措施,加速人工智能赋能重点领域高质量发展
创新“三聚焦”机制 山东寿光全面打通小微企业融资“最后一公里”
山东临沭:用好考核激励“指挥棒”,激发干事创业“新动能”
山东栖霞:强化梯度培育,激活企业高质量发展新动能
山东省发改委农村经济处党支部与省水利厅有关党支部联合开展“党建聚力担使命 水润农经促振兴”主题党日
山东省发展改革委评督处开展“筑牢国家安全防线 永葆初心使命担当”党建共建主题党日活动
一季度山东省固定资产投资增长3.4%,增速好于去年0.1个百分点

绿色能源

促进新能源消纳,山东省能源局将重点抓好三项工作
山东持续提升煤电机组调峰能力,推动煤电向兜底保障性和系统调节性电源转变
山东:深化电力市场化改革,引导和促进新能源高比例消纳
扛牢央企责任,国网山东电力全力确保新能源“量增率稳”高质量发展
结合技术创新和政策引导,山东多举措激励用户主动参与电网调峰和新能源消纳
山东聚力实施“八大行动”,全力保障新能源高水平利用
枣庄市发展改革委开展“五段式”分时电价政策宣传进社区活动
“智汇齐鲁 绿动未来” 2025中国(山东)电力行业创新发展大会在济召开

齐鲁粮油

联合国世界粮食计划署中国办公室到山东开展粮食南南合作技术调研
把好四个关卡,枣庄高质量完成市级储备油轮换工作
以青春之力护航青岛粮安
山东省粮食和储备局组织党员干部赴省廉政教育馆开展警示教育
以学促干 学用相长 山东举办粮食和储备行业安全生产培训班
山东省粮食和储备局举办2025年全民国家安全教育主题活动
国家粮食和储备局调研组在山东调研粮食经纪人工作
滨州召开全市粮食食品产业高质量发展推进会议

价格调控·价格服务

淄博价格指数解读(5-16)
泰安:肉蛋价格小幅波动,蔬菜价格季节性下降(5月8日-5月15日)
山东蒙阴:本周居民生活消费(食)品价格总体上涨1.23%
临沂商城周价格总指数为103.48点,环比持平(5月8日—5月14日)
5月15日枣庄市重要民生商品价格行情稳定
青岛:本周部分粮食价格小幅波动,生猪价格止跌上涨(5.10-5.16)
青岛市价格认证和监测中心开展2025青岛春季国际车展价格监测工作
山东莒县百姓餐桌行情周分析(第660期)

价格监测

发展视觉