更新时间:2023-09-08 19:52:16
封面
版权信息
内容简介
推荐序
前言
本书内容
读者对象
源码下载
致谢
第1章 数据仓库简介
1.1 什么是数据仓库
1.1.1 数据仓库的定义
1.1.2 建立数据仓库的原因
1.2 操作型系统与分析型系统
1.2.1 操作型系统
1.2.2 分析型系统
1.2.3 操作型系统和分析型系统的对比
1.3 抽取—转换—装载
1.3.1 数据抽取
1.3.2 数据转换
1.3.3 数据装载
1.3.4 开发ETL系统的方法
1.4 数据仓库架构
1.4.1 基本架构
1.4.2 主要数据仓库架构
1.4.3 操作型数据存储
1.5 实时数据仓库
1.5.1 流式处理
1.5.2 实时计算
1.5.3 实时数据仓库解决方案
1.6 小结
第2章 数据仓库设计基础
2.1 关系数据模型
2.1.1 关系数据模型中的结构
2.1.2 关系完整性
2.1.3 关系数据库语言
2.1.4 规范化
2.1.5 关系数据模型与数据仓库
2.2 维度数据模型
2.2.1 维度数据模型建模过程
2.2.2 维度规范化
2.2.3 维度数据模型的特点
2.2.4 星型模式
2.2.5 雪花模式
2.3 Data Vault模型
2.3.1 Data Vault模型简介
2.3.2 Data Vault模型的组成部分
2.3.3 Data Vault模型的特点
2.3.4 Data Vault模型的构建
2.3.5 Data Vault模型实例
2.4 数据集市
1.数据集市的概念
2.数据集市与数据仓库的区别
3.数据集市设计
2.5 数据仓库实施步骤
2.6 小结
第3章 Greenplum与数据仓库
3.1 Greenplum简介
3.1.1 历史与现状
3.1.2 MPP——一切皆并行
3.2 Greenplum系统架构
3.2.1 Greenplum与PostgreSQL
3.2.2 Master
3.2.3 Segment
3.2.4 Interconnect
3.3 Greenplum功能特性
3.3.1 存储模式
3.3.2 事务与并发控制
3.3.3 并行查询
3.3.4 并行数据装载
3.3.5 冗余与故障转移
3.3.6 数据库统计
3.4 为什么选择Greenplum
3.4.1 Greenplum还是SQL-on-Hadoop
3.4.2 适合DBA的解决方案
3.4.3 Greenplum的局限
3.5 小结
第4章 Greenplum安装部署
4.1 平台需求
4.1.1 操作系统
4.1.2 硬件和网络
4.1.3 文件系统
4.2 容量评估
4.2.1 可用磁盘空间
4.2.2 用户数据容量
4.2.3 元数据和日志空间
4.2.4 RAID划分最佳实践
4.3 操作系统配置
4.3.1 安装操作系统
4.3.2 禁用SELinux和防火墙
4.3.3 操作系统推荐配置
4.3.4 时钟同步
4.3.5 创建Greenplum管理员账号
4.3.6 安装JDK(可选)
4.4 安装Greenplum软件
4.4.1 安装软件包
4.4.2 配置免密SSH
4.4.3 确认软件安装
4.5 初始化Greenplum数据库系统
4.5.1 创建数据存储区