更新时间:2019-07-30 13:21:05
封面
版权信息
内容提要
前言(第2版)
前言(第1版)
作者介绍
第一篇 大数据基础
第1章 大数据概述
1.1 大数据时代
1.2 大数据的概念
1.3 大数据的影响
1.4 大数据的应用
1.5 大数据关键技术
1.6 大数据计算模式
1.7 大数据产业
1.8 大数据与云计算、物联网
1.9 本章小结
1.10 习题
第2章 大数据处理架构Hadoop
2.1 概述
2.2 Hadoop生态系统
2.3 Hadoop的安装与使用
2.4 本章小结
2.5 习题
实验1 安装Hadoop
第二篇 大数据存储与管理
第3章 分布式文件系统HDFS
3.1 分布式文件系统
3.2 HDFS简介
3.3 HDFS的相关概念
3.4 HDFS体系结构
3.5 HDFS的存储原理
3.6 HDFS的数据读写过程
3.7 HDFS编程实践
3.8 本章小结
3.9 习题
实验2 熟悉常用的HDFS操作
第4章 分布式数据库HBase
4.1 概述
4.2 HBase访问接口
4.3 HBase数据模型
4.4 HBase的实现原理
4.5 HBase运行机制
4.6 HBase编程实践
4.7 本章小结
4.8 习题
实验3 熟悉常用的HBase操作
第5章 NoSQL数据库
5.1 NoSQL简介
5.2 NoSQL兴起的原因
5.3 NoSQL与关系数据库的比较
5.4 NoSQL的四大类型
5.5 NoSQL的三大基石
5.6 从NoSQL到NewSQL数据库
5.7 本章小结
5.8 习题
第6章 云数据库
6.1 云数据库概述
6.2 云数据库产品
6.3 云数据库系统架构
6.4 云数据库实践
6.5 本章小结
6.6 习题
实验4 熟练使用RDS for MySQL数据库
第三篇 大数据处理与分析
第7章 MapReduce
7.1 概述
7.2 MapReduce的工作流程
7.3 实例分析:WordCount
7.4 MapReduce的具体应用
7.5 MapReduce编程实践
7.6 本章小结
7.7 习题
实验5 MapReduce编程初级实践
第8章 Hadoop再探讨
8.1 Hadoop的优化与发展
8.2 HDFS2.0的新特性
8.3 新一代资源管理调度框架YARN
8.4 Hadoop生态系统中具有代表性的功能组件
8.5 本章小结
8.6 习题
第9章 Spark
9.1 概述
9.2 Spark生态系统
9.3 Spark运行架构
9.4 Spark的部署和应用方式
9.5 Spark编程实践
9.6 本章小结
9.7 习题
第10章 流计算
10.1 流计算概述
10.2 流计算的处理流程
10.3 流计算的应用
10.4 开源流计算框架Storm
10.5 Spark Streaming
10.6 本章小结
10.7 习题
第11章 图计算
11.1 图计算简介
11.2 Pregel简介