
3.3 数据管理
数据管理作为企业数据管理规划的核心组成部分与方式举措,其主要包括数据标准与指标管理、主数据管理、元数据管理以及数据质量管理等方面的内容,如图3-2所示。

图3-2 企业数据管理架构
下面依次对其中的内容进行阐述。
1.主数据管理
主数据作为企业数据的核心业务载体(如物料、分类、客户、供应商、科目、组织、岗位、人员等),在多个业务流程中被反复利用与共享,所以在过去的信息化历程中,各个企业都有多个业务系统中存在相同主数据入口与维护方式的问题,其关注点在如何将线下流程搬至线上各部门的业务活动,而忽视了从企业统一视角管理主数据的口径、标准、质量、组织、流程等方面的内容。作为企业数据管理的基础,主数据的管理规划自然成为排头兵。其主要建设内容包括主数据标准、模型、管理组织流程与职责、管理制度与规范、数据清理方案、生命周期闭环管理以及主数据平台建设与集成应用等方面。
2.数据标准与指标管理
从价值管理的角度看,数据标准主要分为两大类:基础数据标准及指标数据标准。其中,基础数据标准管理的主要是主数据与交易数据,作为支撑数据为指标服务,而指标数据标准则对应管理人员相对关注的指标部分,通常为管理人员提供辅助决策分析。在整个数据标准建设过程中,不仅包含数据标准本身,还包含制订标准的组织、标准维护的流程、绩效考核体系、技术平台建设等一系列的内容。后续在数据标准与指标体系规划章节重点讲解。
3.元数据管理
元数据是描述其他数据的数据(Data about Other Data),或者说是用于提供某种资源的有关信息的结构数据(Structured Data)。根据NISO(国家信息标准组织)的定义,元数据是描述、解释、定位或以其他方式使信息资源更容易检索、使用或管理的结构化信息,不需要维护各种工具之间的双向连接来交换数据。其使用目的在于:识别资源;评价资源;追踪资源在使用过程中的变化;实现简单高效的大量网络化数据管理;实现信息资源的有效发现、查找、一体化组织和对使用资源的有效管理。
由于元数据也是数据,因此可以用类似数据的方法在数据库中进行存储和获取。如果提供数据元的组织同时提供描述数据元的元数据,将会使数据元的使用变得准确而高效。用户在使用数据时可以首先查看其元数据以便能够获取自己所需的信息。
元数据分为业务元数据、技术元数据和操作元数据。业务元数据指导技术元数据,是定义业务相关数据的信息,用于辅助定位、理解与访问数据信息。其主要包括业务指标、规则、数据质量规则、专业术语、数据标准、实体与属性等。技术元数据以业务元数据为参考,如数据的存放位置、数据的存储类型、数据的血缘关系等,其中,关联性技术元数据描述了数据之间的关联和数据在信息技术环境中的流转情况,包括技术规则、质量规则的技术描述、字段、衍生字段、维度、统计指标等。操作元数据为两者提供管理支撑,主要包括与元数据管理相关的组织、岗位、职责、流程、版本以及系统生产运行的操作记录等。
元数据的建设内容主要分为三个方面:元数据模型、元数据生命周期管理及元数据治理。其中,元数据模型用于描述内容管理系统中内容的所有元数据属性及相关定义,定义的过程应尽可能实现自动化并简化用户输入。元数据生命周期管理即管理元数据从产生到消亡的全过程,跨越了定义、校核、批准、创建、更新等一系列环节。而元数据治理过程应首先成立相应的元数据治理组织,并明确各主体相应的责任,整个组织建议由三个部分组成:元数据管理委员会、元数据管理工作小组和元数据管理员。
4.数据质量管理
数据质量管理是数据管理的重要组成部分,高质量的数据是企业管理报表和管理驾驶舱建设的重要保证。数据质量的标准见表3-1。
表3-1 数据质量标准

为了保证上述质量标准在企业中得到推行与保障,需要对数据质量的管理方法与建设内容进行梳理。
(1)关于数据质量管理方法
数据质量管理方法有多种,如按需启动项目,对数据质量采取主动保证措施,为未来数据质量的提升提供支持,主要包括明确业务需求、反推数据管理需求、进行设计与实施。也可以对存量数据进行剖析和清洗,提升既有数据质量,具体包括发现问题、分析问题、提升质量和动态验证,最后在检查的过程中发现问题,然后进行问题的原因分析,进而提升数据质量。发现问题以后,针对问题进行整改,需要明确管理组织、管理制度和管理流程。
(2)关于数据质量建设内容
数据质量建设内容主要包括三个方面,即数据质量预防过程、数据质量管理过程和数据质量保障。其中,数据质量预防是指事前控制数据质量,主动发现数据质量问题,减少对后续数据使用的影响。数据质量预防是问题解决驱动和业务需求驱动,需要分析问题产生的根源和业务的真实需求,然后进行相应的系统改造和流程优化,在数据产生的前端进行控制。
数据质量管理过程具体是指针对企业当前的数据应用现状进行质量剖析,确定数据质量的提升范围和提升目标以及与之相配套的质量提升计划;根据数据质量剖析的结果评估数据质量问题的严重性,出具数据质量报告,评估对下游的影响以及可能带来的数据风险;针对不同的问题或者风险进行数据质量整改方案设计,制订相应的数据清洗规则,然后集中进行数据清洗,并对清洗的结果进行监控和持续优化。数据质量的提升需要一定的保障措施,主要是建立数据质量管理组织,制订数据质量管理标准和管理流程,并制订数据质量度量规则,方能有效保证数据质量提升能够顺利落地。
当然,数据质量的提升不是一蹴而就的,而是伴随数据质量工程的逐步迭代与相关组织人员的不断努力以最终达到企业数据质量管理的目标。
5.数据生命周期管理
数据生命周期管理是一种数据管理策略型方法论,用于管理信息系统或企业业务运营、职能管理的数据在整个生命周期内的流动:从创建和初始存储,到它过时被删除。完整的数据生命周期包含创建、存储、使用、共享、归档、销毁等阶段。
数据是企业的资产,其生命周期往往大于硬件设备与系统应用的生命周期。数据的爆发式增长,使企业在数据安全、法规遵从、服务质量等方面均面临着极大的挑战。
(1)数据安全
首先,海量数据的备份、恢复成为难题,系统的高可用性难以保证;其次,客户信息、企业信息等隐私数据在测试、开发、维护等外包环节中面临恶意泄露或意外发布;然后,出于审计等要求的历史数据访问与提供难以保证数据的正确性与不可更新性;最后,多个数据克隆直接导致数据安全环节的增加,数据的访问、发布与获取更加难以控制、跟踪。
(2)法规遵从
集团与行政规范对数据的可用性、安全性与可追溯性提出要求;因不符法规而造成的潜在经济、行政处罚损失往往大大高于系统建设成本;审计、公安、司法等部门对于历史数据的审计均提出了指标性要求;敏感数据的安全性与企业最高领导者的责任直接挂钩,存在触犯法律与企业形象受损的风险。
(3)服务质量
由于海量数据导致的新业务上线难以保证按时、按质交付,系统性能难以保证;数据泄露与系统宕机等事故可能直接导致现有客户的流失、工程的停工,甚至合同违约责任等。
针对上述需要关注的内容,企业面对未来数据管理可能面临的各类挑战,就需要建立起完善的数据生命周期管理机制。具体分为以下几个方面。
(1)组织内部知识体系建设
提高整个集团的数据生命周期管理意识。管理层要首先对数据生命周期管理有较高的认识及推动力,无论是信息化管理抑或是在业务管理过程中不断增强各级单位、各部门对数据全生命周期管理的意识。集团需要有专人或专业组织处理不可预测的数据问题,灵活、高效地应对集团可能出现的数据阻断性问题。每个业务单元的危机处理团队能够用标准的计划和程序向集团级的中央危机处理团队报告。培养内部技术专家,提高对信息人员的技能要求。信息化工作人员对当前企业信息化基础设施以及行业趋势和新技术应具有广泛、深入的了解,并能够定期培训业务用户,使用户具有引入和影响新兴技术在企业中广泛应用的能力(或机制)。
(2)流程及制度建设
建立各类数据(结构化、非结构化)生命周期管理的标准流程。对于数据产生、存储、使用、存档、检索、清除这一系列管理过程,应进行标准化管理,并对集团内各类项目提出统一的管理框架要求。在未来,能够将集团的数据生命周期管理流程推广至施工总承包行业,成为行业范本。优化数据需求提出流程。信息化部门能够准确捕获、评估业务管理及职能管理中的利益相关方所提出的数据需求,并在各类项目的建设中通过信息化部门及业务部门的双向合作,不断优化业务部门提出数据需求至信息化部门进行需求评估的流程。
(3)提出容量规划建设要求
集团层面需对呈爆发式增长的数据量进行提前预测,使整个集团能够作为一个数据集合整体进行容量规划建设。新兴技术不断发展,传感器、社交媒体等外部大数据的存储也需纳入考虑范围。集团应建立起完善的流程,对各级单位、各部门容量规划进行监督、指导并汇总。
(4)合规性建设
对数据从产生到清除的一系列过程,集团均需对下属公司提出要求,并定期监控各级单位的合规性建设执行情况,对相应指标进行考核。对于整个集团所涉及的信息系统建设,需要有官方渠道发布的变革管理措施,例如集团统建的官方公文发布渠道,而不仅仅是用邮件或内部通信工具传递。
(5)技术支撑
开发数据资产库存管理工具。集团未来应逐步推动,将各级单位、各部门的各类项目及日常工作、业务运营过程中所产生的数据进行统一管理,而不是将数据资产局限于项目级管理或公司级管理。集团可通过开发成熟的工具,在提供保密机制的同时提高数据资产在集团内部的流通性。
6.数据安全管理
数据安全管理是企业整体信息化与数字化的基本要求,每个公司都有自己的一套安全体系要求,在大数据平台或其他数据系统中更多的是安全制度的落实、安全制度的提升和安全能力的加强。
通过计划、发展并执行数据安全策略和措施,为数据和信息提供适当的认证、授权、访问和审计。
数据安全有对立的两方面的含义:一是数据本身的安全,主要是指采用现代密码算法对数据进行主动保护,如数据保密、数据完整性保障、双向强身份认证等;二是数据防护的安全,主要是采用现代信息存储手段对数据进行主动防护,如通过磁盘阵列、数据备份、异地容灾等手段保证数据的安全。数据安全是一种主动的保护措施,数据本身的安全必须基于可靠的加密算法与安全体系,主要有对称算法与公开密钥密码体系两种。
数据处理的安全是指如何有效地防止数据在录入、处理、统计或打印中由于硬件故障、断电、死机、人为的误操作、程序缺陷、病毒或黑客等造成的数据库损坏或数据丢失现象,某些敏感或保密的数据可能由不具备资格的人员或操作员阅读,而造成数据泄密等后果。而数据存储的安全是指数据库在系统运行之外的可读性。一旦数据库被盗,即使没有原来的系统程序,照样可以另外编写程序对盗取的数据库进行查看或修改。从这个角度看,不加密的数据库是不安全的,容易造成商业泄密,所以便衍生出数据防泄密这一概念,这就涉及计算机网络通信的保密、安全及软件保护等问题。
针对数据安全管理体系,笔者梳理了以下几个方面的内容。
数据安全管理目标如下。
1)为数据资产读取和变更提供合适的方法、阻止不合适的方法。
2)实现监管对因素性和机密性的要求。
3)确保实现所有利益相关者的隐私性和机密性需求。
数据安全管理具体包括数据安全策略、数据安全技术和数据安全组织建设。
(1)数据安全策略
1)确定数据安全策略框架。
2)制订数据分级规范。
3)制订数据安全保护标准。
4)明确数据安全管理制度及流程。
(2)数据安全技术
1)用户身份认证。
2)角色分工。
3)系统版本管理。
4)系统日志管理。
(3)数据安全组织
1)建立数据安全组织。
2)落实岗位职责。
3)建立安全考核机制。
上面对数据安全管理中安全策略、技术与组织等方面所包含的内容进行了讲解,而关于管理体系的定义与联系,如图3-3所示。

图3-3 数据安全管理体系说明