快捷登录

数据治理:一文讲透数据标准

只看大图  / 倒序浏览   © 文章版权由 admin 解释,禁止匿名转载

作者:admin 2024-7-27 15:29:34
跳转到指定楼层
第一部分 数据标准的必要性

数据标准的必要性体现在提高数据质量、促进数据共享、降低数据管理成本、提高数据维护性和扩展性,以及符合法规和合规要求等多个方面。通过数据标准化,企业能够更有效地管理和利用数据,提升业务效率和竞争力。

1. 提高数据质量

数据标准通过统一数据格式、数据类型、数据命名等规范,确保数据的一致性和准确性,从而提高数据质量。

举例:一家跨国公司在全球各地都有业务,通过统一的客户数据标准(如统一的姓名格式、地址格式、电话号码格式等),避免了不同地区数据格式不一致带来的数据质量问题。

2. 促进数据共享与互操作性

数据标准使得不同系统和部门之间的数据可以无缝对接和共享,提高数据的可用性和互操作性。

举例:在医疗行业,通过采用HL7标准,不同医院和医疗系统之间可以方便地共享患者的电子病历,实现患者信息的无缝对接和传输。

3. 降低数据管理成本

通过数据标准化,可以减少数据清洗、数据转换和数据集成的工作量,从而降低数据管理的成本。

举例:一个大型零售企业通过实施统一的产品数据标准,减少了在数据清洗和转换上的时间和人力成本,使得新产品能够更快地上线和销售。

4. 提高数据的可维护性和可扩展性

数据标准使得数据结构和格式更加规范,便于数据的维护和扩展。当业务需求变化时,标准化的数据更容易进行调整和扩展。

举例:在银行业,通过制定和遵循统一的交易数据标准,能够更容易地进行系统升级和扩展,添加新的金融产品和服务。

5. 符合法规和合规要求

许多行业都有严格的法规和合规要求,数据标准化能够帮助企业更好地遵守这些法规,避免法律风险。

举例:在金融行业,通过采用ISO 20022标准,银行能够确保跨境支付数据符合国际法规要求,提高交易的安全性和透明度。

第二部分 数据标准的定义

数据标准的权威定义可以参考一些国际标准组织和权威机构的定义。以下是两个常用的权威定义:

1、ISO/IEC 11179

ISO/IEC 11179 是一个关于元数据注册的国际标准。根据该标准,数据标准被定义为:

“数据标准是关于数据的内容、格式和结构的规则和指南,用于确保数据的一致性、准确性和完整性。”

2、DAMA(数据管理协会)定义

DAMA是一个权威的数据管理专业组织。根据 DAMA 数据管理知识体系(DAMA-DMBOK),数据标准被定义为:

“数据标准是用于定义、管理和控制数据的一致性和质量的规范、指南和规则。这些标准包括数据定义、数据格式、数据命名和数据编码等方面。”

综上所述,数据标准可以被定义为:

“数据标准是关于数据内容、格式、结构及其管理和使用的规则和指南,用于确保数据的一致性、准确性、完整性和互操作性。”

第三部分 数据标准的分类

参考一些国际标准组织(如ISO)的分类方法,可以将数据标准分为数据内容标准、数据格式标准、元数据标准、数据质量标准、数据交换标准、数据安全和隐私标准及行业和领域特定标准七类。

1、数据内容标准

数据内容标准是对数据项的内容和结构进行规范化的规则和指南,确保数据的一致性、准确性和可理解性。这些标准包括对数据项的命名、定义、类型、格式、长度以及取值范围等方面的规定。

以下是一些具体的例子来说明数据内容标准:

6664727267684.png

6664727287313.png

66647272a1afc.png

2、数据格式标准

数据格式标准是对数据存储、传输和展示的格式进行规范的规则和指南。这些标准确保数据在不同系统和应用之间能够被一致地处理和理解,避免数据格式的不一致导致的数据错误和通信障碍。

以下是一些具体的例子来说明数据格式标准:

66647272c365e.png

3、元数据标准

元数据标准关注的是数据的数据(即元数据)。它们为描述和管理数据提供框架,旨在使数据易于理解、检索和利用。元数据标准确保信息资源(如文件、数据集、系统等)的描述是一致的,从而支持数据的组织、检索和维护。

以下是一些具体的元数据标准和应用示例:

66647272edb0b.png

666472731fd6f.png

6664727345b1d.png

有人会疑惑元数据标准和数据内容标准有什么区别,下面以一个图书馆管理系统为例,说明元数据标准和数据内容标准的区别。

(1)元数据标准在图书馆管理系统中的应用

定义:元数据标准提供了关于图书和其他资料的详细描述信息的规则和规范。这些信息有助于用户和图书馆管理系统理解和处理藏书。

关键要素:

书名(Title)

作者(Author)

出版社(Publisher)

出版日期(Publication Date)

ISBN(International Standard Book Number)

分类号(Dewey Decimal Classification or Library of Congress Classification)

应用举例:

Dublin Core元数据标准:图书馆可以使用Dublin Core元数据标准来描述图书的基本信息。例如,对于一本书,它的Title是"The Great Gatsby",Author是"F. Scott Fitzgerald",Publisher是"Scribner",Publication Date是"1925",ISBN是"9780743273565",分类号是"813/.52"。这些元数据帮助用户在图书馆的数据库中快速找到并了解图书的基本情况。

(2)数据内容标准在图书馆管理系统中的应用

定义:数据内容标准规定了图书馆系统中记录的具体内容的格式和质量。它们确保所有图书信息的准确录入、更新和查询。

关键要素:

图书条目格式:例如,每个图书记录必须包含书名、作者、ISBN、库存数量。

数据类型:书名和作者为字符串类型,ISBN为定长数字字符串,库存数量为整数。

字段长度:ISBN必须为13位数字,书名不超过100字符。

必填字段:书名、作者和ISBN为必填项。

应用举例:

图书登记:在图书馆管理系统中登记新书时,必须按照数据内容标准录入信息。系统会检查ISBN是否符合13位数字的要求,确保没有错误或遗漏。如果库存数量低于某一阈值,系统可能自动触发购书请求。

(3)本质区别

焦点不同:

元数据标准:关注于描述图书的基本信息,以便组织和检索。它们解释了数据的含义和上下文。

数据内容标准:关注于图书信息的具体内容和格式,以确保数据的准确性和一致性。它们规定了数据的结构和验证规则。

应用目的:

元数据标准:使图书的描述信息规范化和标准化,便于管理和访问。

数据内容标准:确保图书馆系统中数据的录入、处理和查询符合特定的质量和格式要求,支持系统的有效运行。

4、数据质量标准

数据质量标准是用于衡量和确保数据准确性、一致性、完整性和及时性的规则和指南。这些标准规定了数据应满足的质量要求,以确保数据能够支持业务决策和操作。以下是数据质量标准的主要维度及举例说明:

6664727367339.png

6664727384ef6.png

以下是某银行希望提高其客户数据的质量,以支持精准的营销和客户服务的案例:

66647273b2afb.png

5、数据交换标准

数据交换标准是用于规范数据在不同系统、应用和组织之间传输和交换的规则和格式。通过这些标准,确保数据在不同环境中的传输过程保持一致性、准确性和完整性,从而实现系统之间的互操作性和高效的数据共享。以下是一些常见的数据交换标准及其应用示例:

66647273d083d.png

6664727401934.png

666472742a556.png

6、数据安全和隐私标准数

据安全和隐私标准是用于保护数据在存储、传输和处理过程中的安全性和隐私性的规则和指南。这些标准确保数据在受到未经授权的访问、泄露、篡改和丢失的情况下依然得到保护,并且符合相关的法律法规要求。

以下是一些常见的数据安全和隐私标准及其应用示例:

6664727442b4d.png

66647274659ce.png

7、行业和领域特定标准

行业和领域特定标准是针对特定行业或领域的数据管理和交换的规则和指南。这些标准根据行业或领域的特殊需求,规范了数据的定义、格式、传输和处理方法,确保行业内不同系统和组织之间的数据互操作性和一致性。以下是一些常见的行业和领域特定标准及其应用示例:

6664727492912.png

66647274ab9f7.png

第四部分 数据标准的制定流程
1、需求分析

需求分析是数据标准制定流程中的重要步骤,旨在识别和明确数据标准的需求,以确保数据标准能够满足组织和业务的实际需要。需求分析的主要任务包括理解业务需求、识别数据问题、定义数据需求和确定标准范围等。

(1)理解业务需求

与业务部门和数据用户沟通,了解他们的业务流程和数据需求,识别需要标准化的数据项。

举例:

业务背景:一家零售企业希望改善库存管理,提高库存数据的准确性和一致性。

分析过程:与库存管理、采购、销售等部门的负责人沟通,了解他们在库存管理中的数据需求和使用场景。

发现:采购部门需要准确的库存数据来进行采购计划,销售部门需要实时的库存数据来防止超卖,库存管理部门需要一致的库存记录来进行盘点和管理。

(2)识别数据问题

通过数据分析和系统审查,发现当前数据管理中存在的问题,确定需要改进和标准化的地方。

举例:

问题发现:通过数据审计,发现不同系统(如采购系统、销售系统、库存管理系统)中的库存数据不一致,导致库存数量错误和管理困难。

具体问题:采购系统中的库存数据未及时更新,导致采购计划不准确。销售系统中的库存数据未实时同步,导致超卖现象频发。库存管理系统中的数据格式不统一,导致数据整合和分析困难。

(3)定义数据需求

根据业务需求和数据问题,明确需要标准化的数据项、数据格式、数据质量要求等。

举例:

66647274e7dfd.png

(4)确定标准范围

根据业务优先级和资源限制,确定数据标准的适用范围和优先级,制定详细的实施计划。

举例:

优先级确定:优先标准化库存数据,确保采购系统、销售系统和库存管理系统中的库存数据一致。

次优先标准化采购数据和销售数据,确保与库存数据的关联性和一致性。

实施计划:

阶段一:制定和实施库存数据标准,进行系统更新和数据同步。

阶段二:制定和实施采购数据和销售数据标准,进行系统更新和数据整合。

阶段三:定期审查和优化数据标准,确保持续改进和适应业务需求。

2、标准草案的编写

在需求分析之后,标准草案的编写是数据标准制定流程中的关键步骤之一。标准草案是对需求分析结果的具体落实,是将需求转化为详细的标准规范文件。标准草案的编写包括定义数据项、制定规则、编写使用说明、确定实施方法及编写示例等步骤。

(1)定义数据项

详细描述每个数据项的名称、定义、数据类型、长度、格式和取值范围。

举例:

666472750a9e9.png

(2)制定规则

制定数据的校验规则、命名规范和数据质量要求等。

6664727528b7a.png

(3)编写使用说明

说明数据标准的应用范围、适用场景和使用方法。

举例:

应用范围:本数据标准适用于公司内部所有涉及产品信息管理的系统,包括ERP系统、库存管理系统和销售管理系统。

适用场景:数据标准适用于产品信息的创建、更新、删除和查询等操作。

使用方法:所有系统在处理产品信息时,必须遵循本标准中的数据定义和校验规则,确保数据一致性和准确性。

(4)确定实施方法

确定数据标准的实施步骤、责任人和时间计划。

666472754ee66.png

(5)编写示例

提供标准实施的具体示例,便于理解和应用。

666472757c35a.png

3、审核与修订

在标准草案的编写之后,审核与修订是数据标准制定流程中的关键步骤。该步骤旨在确保标准草案的准确性、适用性和完整性,通过多方审核和反馈,不断优化和完善数据标准草案,以确保其能够有效应用于实际业务中。审核与修订包括内部审核、外部审核、收集反馈、修订草案及最终审定等步骤。

(1)内部审核

组织内部相关部门和专家对标准草案进行审核。

举例:

审核团队:包括数据管理部门、业务部门、IT部门的代表和数据治理专家。

审核内容:标准草案的定义是否清晰、规则是否合理、应用范围是否适当、实施方法是否可行等。

审核会议:召开内部审核会议,逐条审查草案内容,记录审核意见和建议。

(2)外部审核

邀请外部专家或顾问对标准草案进行评审。

举例:

专家团队:包括行业专家、学术研究人员和顾问。

审核内容:标准草案的行业适应性、先进性和合理性,是否符合行业最佳实践和标准。

审核报告:外部专家提交审核报告,详细列出草案中的优点和不足,以及改进建议。

(3)收集反馈

从审核过程中收集各方意见和建议。

举例:

内部反馈:记录内部审核会议中的每条意见和建议。

外部反馈:整理外部专家的审核报告,提取关键建议和意见。

反馈汇总:将所有反馈意见汇总,分类整理,形成问题清单和改进建议列表。

(4)修订草案

根据收集到的反馈对标准草案进行修订和完善。

举例:

问题识别:从反馈中识别标准草案中的问题,例如定义不明确、规则不合理、实施方法不详细等。

草案修订:逐条修改草案内容,明确数据项定义、优化规则、细化实施方法等。

修订版本:形成修订后的标准草案,并标注修订内容和理由。

(5)最终审定

组织最终审核会议,通过修订后的标准草案,形成正式的标准文件。

举例:

审定会议:召集审核团队和关键利益相关者,召开最终审定会议。

审定流程:逐条审议修订后的草案,确保所有问题已解决,所有建议已采纳。

通过决议:通过会议决议,正式通过修订后的标准草案,形成最终的标准文件。

标准发布:将最终的标准文件发布给相关部门和人员,进行培训和宣传,确保标准的有效实施。

4、发布与实施

审核与修订之后,发布与实施是数据标准制定流程中的关键步骤。这个阶段的目标是正式发布经过审核和修订的数据标准,并确保这些标准在实际业务中得到有效应用和遵守。发布与实施包括标准发布、培训和宣传、实施计划、系统更新及监控与反馈等步骤。

(1)标准发布

正式发布经过审核和修订的数据标准。

举例:

发布方式:通过企业内部邮件、内部公告、企业内部知识库等方式发布数据标准文件。

文件内容:标准文件应包括数据项定义、规则说明、应用范围、实施方法等详细内容。

通知对象:所有相关部门和人员,包括数据管理部门、业务部门、IT部门等。

(2)培训和宣传

对相关人员进行培训,确保他们理解和掌握数据标准的内容和应用方法。

举例:

培训计划:制定培训计划,包括培训时间、地点、培训内容和培训对象。

培训内容:详细讲解数据标准的背景、目的、具体内容和应用方法。

培训方式:可以通过面对面培训、在线培训、培训手册等多种方式进行。

考核与评估:对培训效果进行考核和评估,确保培训目标达到。

(3)实施计划

制定详细的实施计划,包括具体步骤、时间安排、责任人等。

举例:

实施步骤:

阶段一:系统准备阶段,进行系统评估和准备工作。

阶段二:系统更新阶段,对现有系统进行更新和改造。

阶段三:数据迁移阶段,将现有数据转换为符合新标准的数据格式。

阶段四:上线阶段,新标准正式在所有系统中应用。

时间安排:为每个实施步骤制定具体的时间表。

责任人:明确每个实施步骤的责任人和参与人员,确保责任明确。

(4)系统更新

对现有系统进行必要的更新和改造,以支持新的数据标准。

举例:

系统评估:评估现有系统对新数据标准的兼容性,识别需要更新和改造的部分。

系统改造:进行必要的系统开发和测试,确保系统能够支持新数据标准。

数据迁移:将现有数据转换为符合新标准的数据格式,确保数据一致性和准确性。

(5)监控与反馈

建立监控机制,确保数据标准在实施过程中得到遵守,并收集反馈以便进一步改进。

举例:

监控机制:建立数据标准实施的监控机制,定期检查数据标准的执行情况。

反馈收集:收集实施过程中遇到的问题和建议,记录在案。

持续改进:根据收集到的反馈,进行必要的调整和改进,优化数据标准和实施流程。

第五部分 数据标准的治理

数据标准的实施与管理是确保数据标准在组织内被正确应用和维护的关键过程。以下将针对实施过程中的挑战、解决方案进行说明和举例。

1、实施过程中的挑战(1)数据质量差异

描述:组织内不同系统和部门的数据质量存在差异,导致数据整合和标准化过程中出现问题。

举例:在一个多业务部门的企业中,财务部门和销售部门的数据质量标准不一致,导致财务报告和销售报告的数据难以统一和分析。

(2)部门间的协作

问题描述:不同部门在数据标准实施过程中缺乏协作,导致标准的推广和执行困难。

举例:在一个大型制造企业中,生产部门和物流部门对数据标准的理解和执行不同步,导致生产计划和物流安排的协调出现问题。

(3)技术实现难题

描述:现有的技术基础设施可能无法完全支持新的数据标准,导致实施过程中的技术难题。

举例:在一个老旧的银行系统中,核心银行系统的技术架构难以支持新的客户数据标准,导致数据标准的实施需要进行大量系统改造。

2、解决方案(1)建立跨部门的数据管理团队

描述:成立一个包含各部门代表的数据管理团队,确保数据标准实施过程中的协作和一致性。

举例:在一个零售企业中,成立由IT部门、销售部门、采购部门和数据管理部门组成的数据管理团队,共同制定和实施数据标准,确保各部门的需求和标准一致。

(2)使用数据管理工具

描述:引入先进的数据管理工具,支持数据标准的实施和管理,提高数据质量和一致性。

举例:在一个电商平台中,引入数据质量管理工具(如Informatica、Talend等),对客户数据进行清洗、验证和标准化处理,确保数据的一致性和准确性。

(3)定期审查和更新数据标准

描述:定期对数据标准进行审查和更新,确保标准能够适应业务变化和技术发展。

举例:在一个金融机构中,每半年对数据标准进行一次全面审查,根据业务需求和技术进展对标准进行调整和优化,确保数据标准的持续有效性。

第六部分 数据标准的应用案例1、某传统行业型做法和成效

背景:

A公司是中国某特大型国有重点骨干企业,面对海量、多源、异构的数据,迫切需要建立统一的数据标准,以支撑数据的有效管理和利用。

做法:

(1)成立数据标准工作组,统筹规划和推进数据标准的制定和实施。

(2)基于国家标准和行业标准,结合公司业务特点,制定了一系列企业级数据标准,包括数据元标准、数据编码标准、数据质量标准、数据安全标准等。

(3)建立数据标准管理平台,支持标准的在线查询、下载和应用。

(4)将数据标准嵌入数据管理流程,如数据采集、清洗、存储、交换等环节,确保标准的落地执行。

(5)开展数据标准宣贯培训,提高全员的标准意识和应用能力。

成效:

(1)形成了覆盖全业务、全流程的数据标准体系,实现了数据的标准化采集、存储和交换。

(2)提高了数据质量,业务数据的完整性、准确性和一致性显著改善。

(3)促进了数据共享,不同部门、不同系统间的数据交换更加顺畅,数据孤岛问题得到缓解。

(4)降低了数据管理成本,数据标准化减少了数据清洗和转换的工作量。

(5)为各类数据应用奠定了基础,如数据分析、数据挖掘、辅助决策等,释放了数据价值。

2、某传统互联网行业型做法和成效

背景:

B公司是全球领先的电商平台,业务涉及零售、金融、物流、云计算等多个领域。随着业务的快速发展,B公司积累了海量的用户数据、交易数据、物流数据等,亟需通过数据标准化来提升数据管理和数据应用的效率。

做法:

(1)设立数据委员会,负责顶层设计和统筹推进数据标准化工作。

(2)制定B公司数据标准体系,涵盖概念标准、指标标准、维度标准、业务规则标准等内容。

(3)建立统一的数据资产平台,基于数据标准实现数据的统一采集、存储、加工和服务。

(4)推行数据标准在各业务线的应用,如在数据仓库、数据集市、数据报表等场景中广泛使用标准化的数据。

(5)建立数据标准的持续优化机制,根据业务变化动态调整和更新标准。

成效:

(1)打通了各业务领域的数据壁垒,实现了全域数据的标准化管理和共享应用。

(2)提升了数据质量,为数据分析和决策提供了可信的数据基础。

(3)加速了数据应用的开发和交付,标准化的数据接口和数据服务大大提高了数据供给的效率。

(4)促进了业务协同,基于标准化的数据,不同业务部门能够高效协作,促进业务创新。

(5)增强了数据治理,通过数据标准的执行,提高了数据管理的规范性和可审计性。

以上两个案例,都是以业务需求为导向,自上而下推动数据标准的制定和实施,并将数据标准深度融入数据管理流程和数据应用场景,从而实现了数据管理效率和数据价值的双提升。当然,每个企业的数据状况和业务特点不尽相同,在实际实施中还需要因企制宜,探索符合自身实际的数据标准之路。


(以上内容摘录自网络,如有侵权请联系删除)


分享:

成为第一个回答人

高级模式 评论
您需要登录后才可以回帖 登录 | 立即注册