新闻热线:010-63691890 投稿邮箱:cehsds@126.com

工业企业欲彻底解决数据质量,唯有源端+末端综合数据治理

1

当下,数据治理的理念、书籍以及各种软文铺天盖地,仔细分辨大部分是基于DAMA或者DCMM相关理念基础。无论是DAMA理论体系还是DCMM模型中数据治理的内容无外乎包括解决数据质量、数据安全、数据应用服务以及提升解决以上三个问题的能力。

可以感觉到,所有人都已经深刻的认识到数据质量是数据治理中的核心所在,也是最难解决的问题,但大部分的理念、方案在解决数据质量方面相对传统且力度较浅。

目前市面上主要存在以下两种数据治理模式,具体如下:

1) 源端数据治理,是指通过解决业务系统源头数据质量的问题,实现提高数据分析的准确率。

2) 末端数据治理,是指针对解决数据全生命周期的末端(数据仓库层)数据质量的问题,实现提高数据分析的准确率。

 

企业数据治理之源端模式


针对源端的数据治理是主流的数据治理模式,目前行业内80%以上的方案都是如此。如静态数据治理、主数据管理、编码管理等,都是属于针对业务系统的直接影响实现数据质量的改造,最终达到支撑数据应用分析的目的。

源端数据治理模式适用的企业,包括生产型企业、大型集团本部、运营管控型集团等的初步治理。

源端数据治理支撑数据分析及业务管理框架,具体如下图所示。

图 源端数据治理支撑数据分析及业务管理

图 源端数据治理支撑数据分析及业务管理

由上图可以看出,数据治理平台新增数据或者通过数据交换平台(Exchange)从业务系统采集数据进行规范、改造后,一方面冗余数据自动进入数据映射关系库,另一方面改造后的数据再次回传到对应业务系统实现对业务系统数据质量的改造(业务系统运行的前提下)。

当ETL从业务系统中抽取数据的时候,同时从冗余数据映射关系库中抽取冗余数据的关系参照,在加载到数据仓库时会注明某些编码(数据)对应的业务实体对象其实是一个,这样未来进行数据分析时可以实现同一业务实体对象不同编码的业务数据的累加,从而最大化实现数据分析的精确度。

 

企业数据治理之末端模式


关于末端的数据治理,目前存在的形式比较多,最传统的应该是借用ETL进行数据清洗的模式,这种模式基本都是结合数仓、BI的实施展开的,但是多年来的经验告诉我们效果非常之不理想。因此,在AI技术刚刚萌芽之际,很多人把希望都寄托于AI技术能力挽狂澜,殊不知复杂的汉语环境更是让纯AI技术尴尬无比,比较典型的是数据中台中的AI技术进行数据质量的打通,结果一塌糊涂。

综上所述,纯技术的手段几乎无法“撼动”数据质量这座大山,再高端的技术也不行。

因此,多年的经验告诉我们,数据质量的识别除了需要各种技术之外,还需要有长期积累的模型、标准以及人的配合才行,具体如下图所示。

图 数据质量识别的技术架构

图 数据质量识别的技术架构

长期的经验积累在数据治理行业非常重要,至少现阶段海量的标准模型、标准数据以及超前的理念可以最大程度的弥补AI技术的短板,可以让相关AI技术发挥到极致,具体细节不在此详述了。

有了可靠的数据质量识别技术,我们就可以在数据仓库层面游刃有余地解决数据质量问题了,这也就是我们所说的末端数据治理。

具体的末端数据治理技术架构如下图所示。

图 企业末端数据治理技术架构

图 企业末端数据治理技术架构

从上图可以看出,所谓的末端数据治理, 是指数据被集成到原业务系统外的某个区域(一般指数仓的ODS层,即数仓的操作数据存储层)后集中进行质量识别、处理的过程。此模式适用于金融、保险等服务型企业以及战略管控型或者财务管控型的大型企业集团(央企或者大型国企)的顶层数据分析情况,金融、保险公司没有物资类数据,战略管控型或者财务管控型的大型企业集团(央企或者大型国企)大部分数据来源于二、三级单位上报的数据,本部系统比较简单,数据量较少、较单一。

综上,可以看出源端数据治理是直接针对业务系统数据源头质量的影响,末端数据治理属于针对数据汇集后的数据质量的影响。事实证明,两种数据治理模式对数据质量的影响都无法达到最彻底的程度,如源端数据治理很难通过正则表达式等的校验方式发现例如错别字等的问题,末端数据治理也很难通过纯AI等的检测方式发现工业企业特有的物资类数据的深层次质量问题。

因此,中翰软件源端+末端数据治理的方案现阶段得到了很多工业企业的认可并选用,具体如下图。

图 源端+末端数据治理模式

图 源端+末端数据治理模式

工业企业数据治理经验证明,纯源端数据治理模式可以实现70%左右的数据质量的解决,侧重在数据仓库端解决数据质量的末端数据治理模式只可以实现50%左右数据质量的解决,源端+末端的数据治理模式可以实现95%左右数据质量的解决。(山东中翰软件有限公司)

发展改革·区域聚焦

济宁印发2025年国民经济和社会发展计划,明确经济社会发展预期目标和重点任务
山东推出28条具体措施,加速人工智能赋能重点领域高质量发展
创新“三聚焦”机制 山东寿光全面打通小微企业融资“最后一公里”
山东临沭:用好考核激励“指挥棒”,激发干事创业“新动能”
山东栖霞:强化梯度培育,激活企业高质量发展新动能
山东省发改委农村经济处党支部与省水利厅有关党支部联合开展“党建聚力担使命 水润农经促振兴”主题党日
山东省发展改革委评督处开展“筑牢国家安全防线 永葆初心使命担当”党建共建主题党日活动
一季度山东省固定资产投资增长3.4%,增速好于去年0.1个百分点

绿色能源

促进新能源消纳,山东省能源局将重点抓好三项工作
山东持续提升煤电机组调峰能力,推动煤电向兜底保障性和系统调节性电源转变
山东:深化电力市场化改革,引导和促进新能源高比例消纳
扛牢央企责任,国网山东电力全力确保新能源“量增率稳”高质量发展
结合技术创新和政策引导,山东多举措激励用户主动参与电网调峰和新能源消纳
山东聚力实施“八大行动”,全力保障新能源高水平利用
枣庄市发展改革委开展“五段式”分时电价政策宣传进社区活动
“智汇齐鲁 绿动未来” 2025中国(山东)电力行业创新发展大会在济召开

齐鲁粮油

联合国世界粮食计划署中国办公室到山东开展粮食南南合作技术调研
把好四个关卡,枣庄高质量完成市级储备油轮换工作
以青春之力护航青岛粮安
山东省粮食和储备局组织党员干部赴省廉政教育馆开展警示教育
以学促干 学用相长 山东举办粮食和储备行业安全生产培训班
山东省粮食和储备局举办2025年全民国家安全教育主题活动
国家粮食和储备局调研组在山东调研粮食经纪人工作
滨州召开全市粮食食品产业高质量发展推进会议

价格调控·价格服务

淄博价格指数解读(5-16)
泰安:肉蛋价格小幅波动,蔬菜价格季节性下降(5月8日-5月15日)
山东蒙阴:本周居民生活消费(食)品价格总体上涨1.23%
临沂商城周价格总指数为103.48点,环比持平(5月8日—5月14日)
5月15日枣庄市重要民生商品价格行情稳定
青岛:本周部分粮食价格小幅波动,生猪价格止跌上涨(5.10-5.16)
青岛市价格认证和监测中心开展2025青岛春季国际车展价格监测工作
山东莒县百姓餐桌行情周分析(第660期)

价格监测

发展视觉