数据治理工具图谱全景图
本文未对数据治理与数据管理进行严格的定义与区分,数据治理的主要工作仍然被理解为战略、指导与决策。本图谱中所列工具不局限于支撑治理本身的工具,还包含了数据管理的工具和对数据生命周期操作的工具。
(一)治理战略层
为提供数据治理战略规划、评估、指导、监控的工具或功能。主要包括五大过程域:组织与职责、体系与制度、团队与文化、计划与监控、成效与评估,其中:
1.组织与职责:对数据治理组织及其职责进行规划、管理的工具或功能。
2.体系与制度:对数据治理相关体系、制度、流程进行管理、发布的工具或功能。
3.团队与文化:提供数据治理文化发布、查询、学习培训等工具或 功能。
4.计划与监控:提供数据治理项目管理及监控的工具或功能。
5.成效与评估:对数据治理成效提供评估依据及评估行为的工具或功能。受企业的业务架构和技术架构的影响,治理战略层的工具形态会有差异。可以是企业内部通用的信息化平台和电子办公软件,也可以是为数据治理项目专项采购和开发的信息化平台,亦或是线下纸质方式。无论哪种形态,满足过程域能力要求即可,可能的组合包括项目管理工具、文档管理系统、绩效评估系统、信息发布平台、电子办公软件、知识库平台等等。
(二)数据管理层
为应落实数据治理战略而进行的数据管理活动的工具或功能。主要包括八大过程域:数据架构管理、元数据管理、数据标准管理、主数据管理、数据质量管理、数据资产管理、数据安全管理、数据生存周期管理。
1.数据架构管理:提供数据架构规划、设计相关工具及功能,包括数据层次、数据模型和数据流向设计。
2.元数据管理:提供统一的企业元数据存储库,支持相关血缘、影响 分析及变更管理的监控。
3.数据标准管理:提供统一的指标数据技术标准、业务标准、管理标准的视图,具备基本的增删改查及废止功能,可进行标准符合性检测。
4.主数据管理:提供对企业主数据、参考数据统一管理,支持主数据模型定义、数据约束及分发策略的管理。
5.数据质量管理:支持对数据质量建立质量规则,支持数据治理评估,并生成质量报告,提供质量整改机制。
6.数据资产管理:提供企业以资产价值视角的数据管理功能,包括资产索引、资产开发、资产服务等功能。
7.数据安全管理:支持对数据进行安全分级分类,定期监督和执行数据安全策略执行情况。
8.数据生存周期管理:对数据进行生存周期管理,定期监督和检查数据归档和销毁策略执行情况。
(三)数据操作层
为基于治理战略目标要求,以满足数据管理需要,对数据进行操作的工具或功能。主要包括六大过程域:数据存储工具、数据采集工具、 数据处理工具、数据共享交换工具、AI计算支撑工具、数据分析应用工具。
1.数据存储工具:基于数据治理战略及数据架构、数据标准、元数据、质量等管理要求,对数据进行存储。包括分布式存储、传统关系型存 储、文件存储及图数据库存储。
2.数据采集工具:基于数据治理战略要求,完成相关数据采集工作。支持不同采集方式及频率,包括实时采集、离线采集、报表填报采集、 API采集等。
3.数据处理工具:基于数据质量、标准、数据架构等要求,对数据进行加工、转换、清洗、集中等工作。
4.数据共享交换工具:基于业务与之间的数据共享需求,对不同异构数据执行交换或服务。包括文件、库表、接口、实时流等。
5.AI计算支撑工具:将人工智能技术运用到数据采集、处理、共享、 评估、度量等活动中。
6.数据分析应用工具:通过数据可视化、报表等工具完成数据治理的报告、诊断分析、监控图表等的开发制作。