主数据管理:企业数据化建设基础
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1 主数据的认知

1.1 说在主数据之前

1.1.1 两个世界

我们生活在一个客观的世界中,用自己的眼睛去看、鼻子去闻、耳朵去听、舌头去尝、肌肤去感触,这些是我们与生俱来的能力。这些过程也是信息收集的过程,这些收集到的信息会通过我们的神经网络传递到大脑中存储和计算,大脑产出的结果信息指导我们做出对应的行动,待我们的行动作用于客观世界后,其结果再以信息的形式反馈回大脑,这样就形成了信息闭环。信息在这个闭环里往复运动,我们的大脑在这个过程中也不断地对信息进行抽象和总结,从而把这些简单的信息变成更高级的信息,如经验和知识。经验和知识又在更深的层面影响我们对世界的认识和我们的行为。

这个过程如此重要,甚至直接关系到个人的生死乃至人类的生存和发展,促使我们竭尽所能地制造各种工具来帮助我们进行这样的信息循环。比如,在信息的获取方面帮助我们,如望远镜、显微镜、听诊器等是信息获取工具;在信息的传递、存储方面帮助我们,如电话、电报、烽火台等是信息传递工具,而竹简、羊皮、纸张、硬盘等是信息存储工具或称持久化工具;在计算等方面帮助我们,如算盘、计算器、计算机等是信息计算工具。

当我们开始用一个个“0”和“1”的二进制字符串进行信息的传递、存储和计算时,新的信息化革命便开始了。相比上一代或前几代的信息化工具的发明创造,这一次的信息化革命过程对社会的影响更加广泛和深刻,几乎涉及各个方面的信息工具的改变,尤为引人关注的是我们对信息存储模型,以及在这个存储模型之上计算方法的深入探索和研究。这是我们以往所未曾重点关注或没有能力关注的一个环节,也是在信息流转环节中十分重要、关键的环节。以往的这些活动都是在我们的大脑中秘密进行的,但是现在我们可以把这个模型及其内部的计算方式在体外模拟,同时让完整的信息流在体外实现完整闭环,且高度自治。这是有划时代意义的一次改变。而这一切的基础,就是一个相对完整和具有一定规模的数据模型,以及在这个数据模型上的各种计算方法。这个模型具有以下特点。

(1)一个从现实世界抽象出来的数据模型。

(2)数据模型中有众多数据,用以记录现实世界的情况。

(3)交互的界面,让现实世界的情况和虚拟世界保持一致。

这无疑是一个创举,即使这样的数据模型比较粗糙和简陋,但在初期也利用它获得了巨大的价值。我们可以把这个虚拟的世界理解为一个很小的点,这个点基本不受空间和时间的限制。我们通过沟通的界面,把所有现实世界中的情况都映射到这个点里。最后,这个虚拟的世界就和真实的世界变得越来越相似,成为真实世界的一个映射版本。

我们通过这个虚拟的世界可以做很多事情,如下。

1.通信

这个点基本不受空间的限制,即使远隔万里也基本不会受到影响;人们可以方便地利用这个点进行通信和业务协作。

2.记录信息

它可以详细地记录每一个字节的信息,且不会出现任何错误和丢失。如果存储的空间足够大,那么从它启用开始,一直到它结束寿命,所有的信息都会被记录下来。

3.了解过去、洞悉当下、预测未来

我们可以利用这个点里的信息,对过去发生的事情进行回溯和统计,也可以利用各种计算方法对各种宏观和微观的事情进行分析,并使用这些更加准确的分析成果,还可以让这个点具有一定的智能。目前,这些“智能”只是最初的形态,可以接管相对简单的脑力工作。

目前,这个虚拟的世界远没有我们想象中的成熟和广阔,甚至在一个企业内部都不得不被分割成几个、几十个独立的局部模型,这是由我们当前的技术手段、认识的局限性和现实的复杂性所造成的。所以,这个数据模型在追寻价值的方向上,表现出以下发展诉求。

(1)更加翔实地描述真实世界。

(2)描述更加广阔的世界。

(3)能够与其他模型进行交互和协作。

(4)降低与真实世界交互的难度,更方便地获取数据和输出数据。

(5)源源不断的算力需求和对更加复杂、更加有价值的计算模型的需求。

有些人对这个进程激动不已,有些人则显示出了一些担忧。但是无论怎样,目前整体的模型构建权力还是掌握在人类手中的,而我们所建立的数据模型也仅是一个个局部的、微小的、分散的模型,它们各自为政,但都在努力地成长。至少在一个较长的时间段里,我们的主要工作还是竭尽全力地推动它成长和变强。

1.1.2 数字化企业

回到当前的工作中来,本书所关注的对象是企业。目前,企业中的众多独立应用系统和它们所描述的业务模型正在支撑企业的业务运转。我们首先来关注一下这些应用系统是如何运转的,以及我们对它们的期望。

(1)数据库(数据仓库)中有众多二维表,以及这些表中的数据。

(2)系统中有一个后端处理程序负责处理业务逻辑,有一个前端处理程序负责处理交互界面。

(3)让企业的业务能够在系统中流转和记录,同时保证时效性。

(4)系统具有一定的抽象性,当业务发生预测内的变化时可以立即调整。

(5)系统具有一定的开放性,当业务发生变化时可以定制、更改。

(6)当业务大量涌现的时候,系统能够游刃有余地应对。

(7)系统具有合理的业务功能抽象模块,便于未来的扩展和组合。

当前的企业信息化建设是一个个专业业务系统罗列和搭建的过程。在这个过程中,最核心、价值最高、最关键的业务优先被信息系统覆盖,如财务、库存、采购、生产、销售;第二梯队是办公自动化、人力资源管理、客户关系管理、供应商管理等系统;第三梯队是法务、风控等系统。在这个过程中,我们遇到了一些典型的问题,也在一定程度上找到了对应的解决方案,如下。

(1)有一个软件供应商能够提供企业所需要的所有应用软件。

(2)这些应用系统之间可以相互通信,共同组合成一个大的生态体系。

(3)系统集团中的某些应用系统能够上下贯通使用一套软件,能够看到实际的明细情况,而不是被动地等待每周的固定报表。

这些需求对应着平台化、组件化、SOA(面向服务的架构)、集团管控、业务中台、微服务等一系列方案。但是,信息化企业和我们最终所期望的数据化企业还有很大的差别,数据化企业至少应当具有以下特征(非统一视角)。

1.业务线上化

企业信息化建设是企业数据化建设的前提,信息化建设的本意是将线下业务线上化,打破空间的约束,将业务流程标准化和固化,从而大幅提升企业经营效率。但是对于企业数据化建设而言,企业信息化建设则是将这个企业的各种行为有效地映射到数据模型中,数据模型和数据是企业数据化建设的基础。

2.企业透明化

在一个数据化建设完善的企业中,每个岗位都能够在数据权限允许的范围内,不受时间和空间的限制,从而得到更丰富的业务数据和行为数据。比如,集团领导不但可以知道各级企业的汇总报表数据,还可以随时深入查看每一个具体的业务数据,如财务、人力资源数据,他们可以像教练指挥赛场上的球员一样,指挥一个跨国企业。企业透明化可以让企业的组织结构更加扁平,从树形结构变成网状协作结构。

3.数据化思维、量化业务、洞察细节

当企业中所有实体的行为在企业内部都透明时,数据化的业务思维、科学的业务描述体系将会大幅降低工作协作的内耗。尤其是对于管理成本居高不下的大型企业而言,这可以打破以往的管理规模瓶颈,进一步发挥体量优势,同时可以更多地借助数据分析,进行精细化管理和判断。

4.智慧的端倪、对各个层级的能力革命

数据化可能意味着第一次信息可以脱离大脑而在体外进行完整闭环循环,即构建“智慧大脑”。也许很多年后我们发现这个“智慧大脑”和信息化中写好的程序或生产线上的自动手臂并没有本质的区别,但是至少目前人工智能还是让我们感到惊艳的。如果把企业的职位层级比作金字塔,那么这个金字塔中所有的岗位和人员都会在“智慧大脑”的帮助下受益或受到冲击,而且越是底层可能受到的冲击越大。因为,越是底层,工作中机械化、重复性的工作比例越高。但是从整体视角来看,如果说上述内容还是从量上提升企业竞争力的话,那么企业智慧大脑的构建将会从质上改变一个企业。

5.丰富的数据供给和数据驱动

数据化企业中各个岗位、角色都会获得比以往更加丰富、更加准确、更加快速的数据支撑,而且这些数据的“含金量”也将更高。从了解业务的情况到洞察细节的建议,或者对未来的预测,甚至直接越过人类的自主决策和运营等,我们会逐渐从需要数据过渡到被数据驱动。

1.1.3 企业数字化发展阻碍

至少到目前为止,我们只有极少数的企业可以被称作数据化企业,而大部分企业还处于从信息化到数据化的转化过程中,并且这个过程会很复杂和漫长。我们认为至少以下环节是传统企业所需要经历的。

(1)相对完整的信息化建设工作。

(2)完整且质量良好的全域数据及数据治理体系的良好运转。

(3)支持企业全面数据化转型的数据平台。

(4)企业员工的数据化理念,充分的业务统计与分析需求,用数据说话的习惯。

(5)众多的大数据、AI应用场景构想。

目前,很多企业都处于信息化建设初步完成,数据治理体系正在构建,数据平台正在论证与搭建,数据理念不断加强,努力寻找更多数据应用场景和价值的阶段。在这个阶段中,基础数据的统一和高质量供给成为未来企业数据化发展的核心环节。而主数据管理(Main Data Management,MDM)作为这个核心环节的重要解决方案被广泛使用,原因如下。

(1)业务本身需要一套标准的数据模型和数据,用以反映客观存在,否则将带来业务上的混乱,而通过业务上的问题反向推动各个系统数据一致,是一种非常不划算的做法。

(2)多个系统间需要进行数据交换,在交换过程中,如果对于客观实体的模型描述不一致,则业务数据交换将非常烦琐和困难。

(3)当构建数据仓库进行跨业务系统间的数据分析时非常困难。

我们期望,能够在以企业的视角去观察的时候,有一个权威的、完整的、客观实际的模型,然后让所有的系统都能够方便地使用这个模型及模型中的数据。