1.4 主数据管理与数据治理的关系
企业数据化建设是一项体量庞大的系统性工作,这个过程中所涉及的知识体系和各种子任务也是繁多的。同时由于我们所参与的数据化建设的阶段、目标不同,出现了各种数据化建设相关的工作,如主数据管理、数据仓库、数据中心、数据中台、数据分析、数据挖掘、数据质量、数据治理、数据管理、数据资产管理等。每种工作由于工作视角不同,并且为了保证工作的整体完整性和效果,不得不设计一套相对完整的工作内容体系。当我们把这些工作内容进行体系拆分时会发现,各种数据化工作中存在很多重复性工作。因此,当我们把这些工作排重组合后,也许可以形成数据化工作的全集。
但各种数据化工作都从事过的顾问很少,这造成了某些体系之间的冲突和整体视角的混乱。而当前,企业的整体数据化转型已经迫在眉睫,我们不得不从整体视角去看待这个问题,这也给了我们对各种数据工作内容重新划定边界的一个机会。
我们再次回顾几个主要的数据问题,首先是工作对象、数据,我们可以把数据分成以下几类。
(1)基础数据、实体数据、主数据、维度数据、参照数据等。
无论采用什么称呼,这些数据大多数描述的是客观实体或一项核心任务,后续所有发生的行为都会由这些实体产生或围绕这些实体而进行。
(2)交易数据、信息系统数据。
这是一类重要的行为数据,通常会涉及钱、职责等非常重要、关键、严肃的事情或行为,我们所了解到的传统信息化系统所记录的大量业务数据都应当属于这类交易数据。
(3)行为数据、大数据。
这是一类数量非常大、看起来没那么重要,且记录的过程也不是非常严谨的关于实体行为的记录数据,如记录机器的日志数据、记录线上购买者行为的埋点数据、记录汽车行为的行驶轨迹数据等。这些数据通常用于构建标签画像,后续的应用同样会产生巨大的价值。
(4)统计汇总数据、计算结果数据。
这类数据包括指标、标签,以及所有基于上述三类数据计算得出的数据。这些数据在计算之前应当证明业务的需求及其业务价值,因为这些计算是需要花费大量存储资源和算力的。这些数据将直接或者间接地作用于人或者机器,然后产生业务价值。
相对于工作对象、数据,我们把企业数据化建设分解成两部分内容。
(1)数据生产工作。
数据生产工作是把企业中所有的数据汇聚在一起,物理上存储在一个统一的数据仓库中,同时逻辑上归入一个完整的数据模型,然后在这个模型中进行各种各样的数据加工和计算,以产生新的结果数据。这些结果数据会通过各种渠道反作用于业务,解决业务问题,产生业务价值,如提升营收、降低成本、提升效率、控制风险等。这就是我们经常说的数据驱动或数据产生价值。
在数据生产过程中有以下几个关键的阶段。
①数据产生。
②数据采集。
③数据清洗。
④数据存储。
⑤数据加工。
(2)数据治理(管理)工作。
数据生产的过程并不是一帆风顺的,需要经历各种各样的问题。比如,在基础数据这个层次,就可能出现有多个数据版本的问题。在业务数据中,我们会发现很多数据有不同程度的缺失,甚至有些数据的数值明显与其定义和常识相违背;在行为数据中,通常会存在噪声数据等。但不管问题是什么,其最终的表现都是数据不准确。这就像在企业中生产产品一样,无论是流程制造还是离散制造,总的来说,各种物质、物体不断变化、组合或分解,最后从原料、部件变成成品,这个过程中无论工序多么标准、过程多么顺畅,如果没有标注、质量、安全等体系提供支撑和保障,那么最终的产品都很可能出现问题。而数据治理就是数据生产主线的保障体系。
我们认为数据治理工作至少应当包含以下几个部分。
①数据标准。
②数据组织。
③数据质量。
④数据安全。
至于其他数据治理体系规范中所提及的数据治理工作,有些与数据生产体系的内容重合,有些相对次要,所以暂时不做讨论。
数据治理涉及数据生产流程中的每个阶段和每个方面,可以说,数据治理体系稍有缺失或体系运转时的程度稍有减弱都会很快体现在最后的数据成果上。因为本书重点讨论的内容是主数据管理,主数据管理应当归类于基础数据领域,是数据生产体系基础层的内容,所以我们从主数据管理体系来介绍主数据管理体系与数据治理体系中的几个核心部分的关系,同时再做适当的引申和延展。
1.4.1 与数据标准的关系
没有规矩不成方圆,数据标准是数据治理或整体数据化建设的核心。在主数据管理体系中,主数据模型、主数据管理规范、主数据共享技术规范都可以看作数据标准。我们希望将所有数据生产线路上的规范都统一纳入数据标准管理体系。
同时,数据生产过程中的每个环节都需要数据标准的支撑。
数据按照数据层级划分,如表1-1所示。
表1-1
数据按照数据生产过程划分,如表1-2所示。
表1-2
数据标准工作包括以下几个部分。
(1)标准制定。
(2)标准执行。
(3)标准执行效果评估与考核。
(4)标准的维护与修改。
这些数据标准工作是分散的,涉及的范围十分广泛,关系到各个专业的领域和部门,且必须由不同的专业人员参与制定和管理。另外,这些标准具有很强的共性及权威性,需要进行统一管理和维护,同时需要对执行过程进行监控和对执行效果进行评估,在出现问题或环境发生变化后要及时调整和维护,所以统一的数据标准管理、运营体系是必需的。
笔者建议针对数据标准成立标准管理委员会。这个委员会的定位一定要高,具有比较高的权限和比较强的专业能力、决断能力。同时,这个委员会应更偏重于一个虚拟的组织或一个小规模的实体组织,因为这个团队所涉及的工作,需要依靠众多的团队、企业内的业务专家,以及企业外的专业服务团队来一起完成。
1.4.2 与数据组织的关系
与数据生产、加工、治理、管理相关的岗位都可以纳入数据组织的范畴。而且,由于我们对数据工作的重视和数据管理架构被企业引入,企业需要从数据工作的视角建立体系化的数据组织。
我们可以把数据组织分解为两个主要部分。
第一部分是完全以数据工作为核心和主要工作内容的全职数据工作组织。这就和我们在进行企业信息化建设的过程中,要设立信息中心、信息管理部门,甚至设定首席信息官职位一样,当企业进入数据化转型阶段时,我们也希望构建数据组织。
数据组织的职能应至少包含以下内容。
(1)进行企业数据化转型的战略设计及规划工作。
(2)进行企业数据化整体架构工作。
(3)搭建企业数据化建设平台。
(4)搭建数据治理架构,进行数据治理。
(5)与业务部门一起进行数据应用建设与应用创新。
(6)不断完善数据组织并进行组织建设,以符合企业数据化转型的需求。
数据组织中应当包含以下角色或者岗位。
(1)数据分析师。
(2)数据架构师。
(3)数据开发团队。
(4)数据应用产品经理。
(5)数据治理团队。
第二部分是兼职的数据管理工作者。因为除了单独的数据组织部门,还有很多数据工作需要开展,所以我们需要在企业其他岗位中增加很多数据化相关工作内容和职责要求。比如,在进行主数据管理的过程中,数据模型的定义可以由专职的组织来完成,数据规范也可以由专职组织进行管理。但是,在数据产生的过程中需要各个部门和岗位的配合。比如,从以往情况来看,当数据质量出现问题时,需要对传统的数据产生和管理方式进行调整,所以需要其他部门的配合,如在进行项目主数据管理时,项目的命名就可能需要多个部门的共同参与,同时需要知会上下游的相关部门和岗位。
有时,我们也会把这些岗位和增加的工作职责纳入数据组织的范畴,这样能够更加完整地看待所有与数据相关的岗位和职能。数据化建设是一项体量庞大且复杂的工作,在其他数据化工作体系中,数据岗位的划分可能更加烦琐和复杂,建议采用以下原则进行职能划分。
(1)工作饱满性原则。
当企业规模巨大、工作量巨大的时候,应考虑进行岗位拆解,将工作进一步细分,提升工作处理效率。
(2)工作必要性原则。
从企业实际情况出发,做针对性的问题解决和岗位设置,而不是因为需要岗位而设定岗位,或者人为增加工作复杂性而构建更加臃肿的组织。
(3)工作不可替代性原则。
对于某些行业和企业,只有在岗位不可由外部服务厂商替代的情况下,才建议设置内部数据岗位。在很多情况下,企业只保持数据分析、架构等核心岗位就能够与外部服务厂商一同为企业提供相对完整的数据化服务。
对于主数据管理工作,从主数据建模、主数据标准管理,到业务中的主数据管理与维护都离不开数据管理组织的支撑。
1.4.3 与数据质量的关系
很多失败的数据应用,第一理由都归集为数据质量问题导致最后的交付结果数据不准确,以致业务部门最终无法采纳。那么,什么样的问题才算作数据质量问题呢?当数据中很多字段存在大量的空数据时,这是由于数据质量存在问题,还是由于数据模型设计得不合理?
主数据管理最核心的价值在于提升基础数据的整体数据质量,保证数据的及时性和准确性。
1.4.4 与数据安全的关系
主数据是企业的黄金数据,其数据价值不言而喻,所以如何保证主数据的使用安全是我们必须关注的内容。主数据应当完整纳入数据安全管理体系,从数据存储安排、防止窃取和泄露等诸多方面予以全方位的保障。