第一节 数据治理的内涵与特征
一、数据治理的内涵
数据治理是大数据时代数据资产变现和数据价值实现的重要手段,备受业界和相关领域研究者的关注。不同领域的研究者对数据治理内涵的界定,因受看待问题的视角和分析手段的约束,恰好为当前的数据治理赋予了丰富的内容与形式,其中比较有代表性的观点如下。
张绍华等人认为,数据治理是对组织的大数据管理和利用进行评估、指导和监督的体系框架,它通过制定战略方针、建立组织架构、明确责任分工等,实现大数据的风险可控、安全合规、绩效提升和价值创造,并提供不断创新的大数据服务[1];Malik 认为,数据治理蕴含在决策及与数据相关的各类事物中,包括政策、规则、权利、组织结构、个体的责任和信息系统,这些与信息处理过程相关的事物会影响组织业务目标的完成[2];B.Otto认为,数据治理是指在企业中,数据管理的相应职责和决策权的分配,数据治理旨在将数据的价值最大化[3];L.Cheong认为,数据治理是企业管理数据数量、一致性、易用性、安全性和可用性的过程[4];P.Sonia认为,数据治理是一个决策、职责和流程有机组合的系统,该系统确保对重要的数据资产和信息进行正规统一的管理[5];D.Loshin 认为,数据治理主要是研究与数据治理相关的5个核心概念:数据消费者期望的管理、关键数据质量维度的界定、元数据一致性的监测、数据更新与解释、数据增强[6];桑尼尔·索雷斯则认为,数据治理是广义信息治理计划的一部分,即制定与大数据有关的数据优化、隐私保护与数据变现的政策[7]。
综上所述,不同研究者分别从治理体系构建、组织目标服务计划、数据价值最大化、数据治理计划及数据政策等视角对当前的数据治理进行了内涵界定,无论是其中的哪个角度,研究者都希望运用一定的方式和方法厘清数据与数据、数据与个人、数据与企业、数据与政府的关系,从而将数据的潜在价值变为显在价值,其着重强调的是对大数据价值挖掘与运用的过程,特别关注大数据与其他事物相互联系的价值关系。
二、数据治理的特征
在大数据时代,数据具有体量巨大、类型繁多、处理速度快、价值高而密度低等特征,如图1-1所示[8]。
图1-1 大数据的“4Ⅴ”特征
大数据的这些特征,决定了针对大数据所进行的数据治理的特征也具有多样性。其中,主要包括数据治理的过程是多方协同互动的;数据治理不能只针对局部数据进行分析;数据治理具有明显的时间要求;数据治理不能忽视治理主体能力等。
1.关联性
数据治理的关联性是指在数据价值的挖掘与应用过程中,要充分考虑不同种类的数据与数据之间、不同种类的数据与数据治理主体(收集者、处理者、应用者和监督者)之间、数据的生产者与数据治理主体之间的相互作用和相互影响的关系。在数据治理的过程中,首先,能够正确处理数据与数据之间的关联性,是建立数据知识图谱、数据地图、数据库,以及实现数据价值的重要环节;其次,基于不同种类的数据,以及参与治理的主体的多元性等特征,要求数据治理主体能准确把握数据标准、数据质量、数据安全、数据主体的权责在治理的不同环节的关联性;最后,就数据的权属与利益而言,数据的所有权人与数据治理主体之间还需要厘清数据的所有权、使用权、收益权、审计权、删除权等数据权利及与之相关的利益关系。
2.整体性
数据治理的整体性是指数据治理主体在对某一领域的数据进行治理时,凡是与数据价值变现可能相关的数据,都要全部纳入治理范围。数据治理分为传统的数据治理与现代化的数据治理。传统的数据治理重点任务在于对局部数据分析和运用,其治理过程重点强调的是独立维度的数据整合,缺乏对数据的整体性认识,包括缺乏对多维数据之间相关性的认识,以及没有认识到全数据比抽样数据更具有代表性,这导致了传统的数据治理存在固有的缺陷和误差。
现代化的数据治理在继承传统数据治理优点的同时,也摒弃了传统数据治理的缺陷。现代化的数据治理充分结合大数据时代已有的数据治理技术和治理水平,将数据治理的重点任务转向整体数据的相关性分析和运用,强调的是用全数据代替样本数据,基本要求是在治理好局部数据的前提下对整体数据进行综合治理。所以,其在数据的整个治理过程中都体现了显著的整体性特征。
3.时效性
数据治理的时效性是指在数据治理的过程中,拥有快速适应数据生产者生产数据的速度、数据价值失效前挖掘出数据价值的速度,以及数据应用适应市场变化的能力。数据治理的时效性特征来源于大数据处理速度快的时效性要求。在互联网和大数据时代,数据治理的主体必须要在数据价值没有失效之前将其价值挖掘出来,并快速响应市场需求,这样才能保证在数据治理体系中体现其治理的价值和意义。这就要求数据治理主体在治理数据的过程中,能及时快速响应数据环境的变化,对于数据的分析和运用也要具备精准和快速两个特征。
4.匹配性
数据治理的匹配性是指数据治理主体对数据的治理,要与数据治理主体本身的管理与运营模式、业务规模及风险控制能力等相适应。数据治理主体对于数据治理的过程,不是一个盲目的过程,而是一个有目标的行动过程。在数据治理过程中,凡是脱离数据治理主体自身实际的数据治理,其治理结果要么与目标出现较大的偏差,要么直接导致治理的结果与治理目标背道而驰。因此,数据治理过程必须体现数据治理的匹配性特征。在数据治理开始之前,数据治理主体要对自身的治理能力进行充分评估,包括对本身所拥有的管理与运营模式、业务规模、风险控制能力等方面的评估,同时还要坚持采用以终为始的预测性评估、治理的过程评估和治理结果的评估等评估工具,实时调整自身治理的进度和治理的规模。