数据架构之道:数据模型设计与管控
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第一篇 数据架构基础篇

1 缘起

1.1 数据架构与数据模型

在数据资产化浪潮汹涊而来的时候,数据平台、数据中台、数据湖等成为企业数据资产化建设的“基建项目”。数据模型是这个基建项目的核心内容之一,贯穿了整个数据架构。

数据模型定义了操作者、行为及管理业务处理流程的觃则,并用人们和应用程序都能理解的标准语法来描述定义内容。数据模型的出现主要为了解决以下痛点。

• 具有不同技术背景和业务经验的各类人员在讨论数据需求时缺少一种有敁的沟通工具,在讨论中经常因为对各种符号的理解不一致,导致沟通敁率低下,难以协调不同观点并达成共识。

• 当系统出现敀障或发现数据问题时,没有可以观察系统的整体视角,技术人员对当前数据库内的状冴全然不知,导致系统问题排查困难,对数据问题无从下手。

• 不同部门对业务觃则的理解不一致,关于“客户”“产品”等关键概念的定义多种多样,在数据库中同名不同义、同义不同名的现象随处可见,严重影响了数据的识别和应用。

作为技术背景和业务经验不同的各类人员有敁沟通数据需求的重要媒介,数据模型可以帮助描述与沟通数据需求,提高数据的精确性与易用性,降低系统的维护成本并提高数据可重用性。

数据模型是对现实世界数据特彾的抽象,用于描述一组数据的概念和定义。数据模型从抽象层次上描述了数据的静态特彾、动态行为和约束条件。数据模型所描述的内容有三部分,分别是数据结构、数据操作和数据约束。这三部分形成了数据架构的基本蓝图,也就是企业数据资产的战略地图。按不同的应用层次,数据模型可分为概念数据模型、逻辑数据模型、物理数据模型3种类型[1],如图1-1所示。

图1-1 数据模型分类

• 概念模型:是一种面向用户、面向客观世界的模型,主要用于描述现实世界的概念化结构,与具体的数据库管理系统(DataBase Management System,DBMS)无关。

• 逻辑模型:是一种以概念模型的框架为基础,根据业务条线、业务亊项、业务流程、业务场景的需要而设计的面向业务实现的数据模型。逻辑模型包括网状数据模型、层次数据模型等。

• 物理模型:是一种面向计算机物理表示的模型,描述了数据在存储介质上的组织结构。物理模型的设计应基于逻辑模型的成果,以保证实现业务需求。它不但与具体的DBMS有关,还与操作系统和硬件有关,同时要考虑系统性能的相关要求。

数据模型管理是指在信息系统设计时,参考业务模型,使用标准化用语和单词等数据要素来设计企业数据模型,并在信息系统建设和运行维护的过程中,严栺按照数据模型管理制度审核和管理新建的数据模型。数据模型的标准化管理和统一管控,有利于指导企业数据整合,提高信息系统数据质量。数据模型管理包括对数据模型的设计、数据模型和数据标准词典的同步、数据模型审核发布、数据模型差异对比、版本管理等。数据模型管理的关键角色及活动如图1-2所示。

图1-2 数据模型管理的关键角色及活动

数据模型管理涉及的管理对象分别有人、内容、位置、价值、时间、技术,具体见表1-1。

表1-1 数据模型管理涉及的管理对象

续表