前言
编写背景
感谢你翻开这本书。
2016年年底,我从一家知名外企辞职,离开了呕心沥血11年打造的数据建模鼻祖产品及其全球研发负责人的岗位,开启了创业之旅。那时互联网如日中天,数据领域才刚刚起步。我常常也会心怀疑虑,数字化转型能走多远?未来还需要数据建模吗?过去十几年的经验能在时代大潮中经受住考验吗?
5年后的今天,答案显而易见。数据应用在各行业中百花齐放,精准营销、金融风控、无人驾驶、智慧农业,可以说是无处不在。而数据模型、数据架构也开始再次被人们所认识和重视。数据中台在被“热炒”的大浪中退去,我们发现其最终沉淀下来的不是各种光鲜或不知所云的新概念,而是人们对业务及数据的深刻理解,这些都沉淀在了数据模型中。
本书从数据架构的基本概念入手,从业务系统的三范式模型到数据仓库的维度模型、Data Vault模型,结合大量的行业实例及绘图进行展示,分析了数据模型的本质,并针对模型给出了详细解读。
本书适合正在建设数据中台、数据仓库及业务系统的业内人士,以及觉得模型晦涩难懂、无所适从的初学者,也适合作为计算机相关专业的教材。本书能帮助你理解经典的模型设计,并让你获得足够多的经验和实践技巧,以便更好地分析和解决问题。
更重要的是——体会到数据模型之美!
读者对象
本书适用于以下读者群体。
• 企业管理者
管理者决定着企业的发展方向、企业的数字化转型战略落地和数据业务化,业务流程、业务架构最终都通过数据架构落实到业务和技术实现中。企业需要具备“架构”能力,这种能力应该由管理者带头,从业务架构能力开始自上而下地建立起来。
• 数据架构师、数据建模师
数据架构师是综合型人才,既懂数据,又懂业务。数据模型是他们用来连通业务与数据之间鸿沟的最有力的工具。
• 技术人员、数据开发人员
数据开发人员忙于完成具体数据需求的任务,常常“只见树木,不见森林”,陷入不断拆解指标和澄清指标的沼泽中。数据模型一方面帮助数据开发人员从更广的业务视角来考虑数据仓库、数据中台、数据湖的整体设计;另一方面,有助于数据开发人员快速理解业务,并使其与业务人员更好地进行沟通。
• 业务人员
在实现业务与数据融合方面,业务人员会更关注数据对业务场景的支撑和价值,而忽略了底层的业务与数据。本书中的概念模型、逻辑模型都是对业务的描述,门槛相对较低,有助于业务人员走入数据的领域,提高业务人员与数据的交互度。
本书特色
本书旨在成为一本让各类读者都可以读得懂的数据架构和数据模型指南。
全书分为4篇,共16章,各篇章内容简介如下。
• 数据架构基础篇(第1~3章)
第1章介绍数据架构与数据模型的发展历史。第2章介绍企业架构及其与数据治理的关系。第3章介绍数据模型的基本概念,包括概念模型、逻辑模型、物理模型。
• 数据模型设计篇(第4~9章)
第4章介绍如何通过数据模型记分卡来衡量数据模型的质量。第5章介绍范式建模,包括第一、二、三范式等。第6章介绍数据仓库中的数据模型设计。第7章介绍维度建模,包括星型、雪花、星座模式等。第8章介绍Data Vault建模。第9章介绍统一星型模型建模。
• 数据模型落地篇(第10~12章)
第10章介绍数据模型管控,阐述模型设计完成后如何进行评审和管控。第11章介绍数据架构与数据治理的关系,以及数据模型与元数据的关系。第12章介绍数据模型与数据标准的关系。
• 行业数据模型篇(第13~16章)
第13章介绍证券资管行业的数据架构及模型。第14章介绍保险行业的数据架构及模型。第15章介绍教育行业的数据架构及模型。第16章介绍航空公司的数据架构及模型。
建议和反馈
由于作者的水平有限,书中难免存在一些不足之处,恳请读者批评指正,以便我们改进和提高,并惠及更多的读者。如果你对本书有任何评论和建议或者遇到问题需要帮助,可以致信作者邮箱wzheng824@gmail.com,我将不胜感激。期待读者的真挚反馈,以期在探索数据架构、数据模型的道路上互勉共进。
致谢
感谢各位作者在数据领域的坚持和多年耕耘。感谢我的家人和朋友在本书编写过程中提供的大力支持!感谢提供宝贵意见的行业专家!感恩我遇到的众多良师益友!