更新时间:2020-06-18 15:08:01
封面
版权信息
内容提要
前言
作者介绍
第一篇 大数据基础
第1章 大数据概述
1.1 大数据时代
1.2 大数据的概念
1.3 大数据的影响
1.4 大数据的应用
1.5 大数据关键技术
1.6 大数据计算模式
1.7 大数据产业
1.8 大数据与云计算、物联网
1.9 本章小结
1.10 习题
第2章 大数据处理架构Hadoop
2.1 概述
2.2 Hadoop的项目结构
2.3 Hadoop的安装与使用
2.4 本章小结
2.5 习题
第二篇 大数据存储
第3章 Hadoop分布式文件系统
3.1 分布式文件系统
3.2 HDFS简介
3.3 HDFS的相关概念
3.4 HDFS体系结构
3.5 HDFS的存储原理
3.6 HDFS的数据读写过程
3.7 HDFS编程实践
3.8 本章小结
3.9 习题
第4章 分布式数据库HBase
4.1 概述
4.2 HBase访问接口
4.3 HBase数据模型
4.4 HBase的实现原理
4.5 HBase运行机制
4.6 HBase编程实践
4.7 本章小结
4.8 习题
第5章 NoSQL数据库
5.1 NoSQL简介
5.2 NoSQL兴起的原因
5.3 NoSQL与关系数据库的比较
5.4 NoSQL的四大类型
5.5 NoSQL的三大基石
5.6 从NoSQL到NewSQL数据库
5.7 本章小结
5.8 习题
第6章 云数据库
6.1 云数据库概述
6.2 云数据库产品
6.3 云数据库系统架构
6.4 云数据库实践
6.5 本章小结
6.6 习题
第三篇 大数据处理与分析
第7章 MapReduce
7.1 概述
7.2 MapReduce的工作流程
7.3 实例分析:WordCount
7.4 MapReduce的具体应用
7.5 MapReduce编程实践
7.6 本章小结
7.7 习题
第8章 流计算
8.1 流计算概述
8.2 流计算的处理流程
8.3 流计算的应用
8.4 开源流计算框架Storm
8.5 本章小结
8.6 习题
第9章 图计算
9.1 图计算简介
9.2 Pregel简介
9.3 Pregel图计算模型
9.4 Pregel的C++API
9.5 Pregel的体系结构
9.6 Pregel的应用实例
9.7 Pregel和MapReduce实现PageRank算法的对比
9.8 本章小结
9.9 习题
第10章 数据可视化
10.1 可视化概述
10.2 可视化工具
10.3 可视化典型案例
10.4 本章小结
10.5 习题
第四篇 大数据应用
第11章 大数据在互联网领域的应用
11.1 推荐系统概述
11.2 协同过滤
11.3 协同过滤实践
11.4 本章小结
11.5 习题
第12章 大数据在生物医学领域的应用
12.1 流行病预测