更新时间:2018-12-27 17:42:04
封面
版权信息
前言
第1章 神奇的大象——Hadoop
1.1 初识神象
1.2 Hadoop初体验
1.3 Hadoop族群
1.4 Hadoop安装
第2章 HDFS——不怕故障的海量存储
2.1 开源的GFS——HDFS
2.2 HDFS常用操作
2.3 HDFS API之旅
2.4 实战:用HDFS存储海量视频数据
第3章 分久必合——MapReduce
3.1 MapReduce基础
3.2 样例分析:单词计数
3.3 MapReduce,你够了解吗
3.4 实战:倒排索引
第4章 一张无限大的表——HBase
4.1 HBase简介
4.2 HBase入门
4.3 HBase操作演练
4.4 实战:使用MapReduce构建HBase索引
第5章 更上一层楼——MapReduce进阶
5.1 简介
5.2 复合键值对的使用
5.3 用户定制数据类型
5.4 用户定制输入/输出格式
5.5 用户定制Partitioner和Combiner
5.6 组合式MapReduce计算作业
5.7 多数据源的连接
5.8 全局参数/数据文件的传递与使用
5.9 关系数据库的连接与访问
第6章 Hive——飞进数据仓库的小蜜蜂
6.1 Hive的组成
6.2 搭建蜂房——Hive安装
6.3 Hive的服务
6.4 HiveQL的使用
6.5 Hive示例
6.6 实战:基于Hive的Hadoop日志分析
第7章 Pig——一头什么都能吃的猪
7.1 Pig的基本框架
7.2 Pig的安装
7.3 Pig的使用
7.4 Pig Latin编程语言
7.5 实战:基于Pig的通话记录查询
第8章 Facebook的女神——Cassandra
8.1 洞察Cassandra的全貌
8.2 让Cassandra飞
8.3 Cassandra操作示例
8.4 Cassandra与MapReduce结合
第9章 Chukwa——收集数据的大乌龟
9.1 初识Chukwa
9.2 Chukwa架构与设计
9.3 Chukwa安装与配置
9.4 Chukwa小试
第10章 一统天下——ZooKeeper
10.1 Zookeeper是个谜
10.2 ZooKeeper安装和编程
10.3 ZooKeeper演练:进程调度系统
10.4 实战演练:ZooKeeper实现NameNode自动切换
第11章 综合实战1——打造一个搜索引擎
11.1 系统工作原理
11.2 网页搜集与信息提取
11.3 基于MapReduce的预处理
11.4 建立Web信息查询服务
11.5 系统优化
11.6 本章总结
第12章 综合实战2——生物信息学应用
12.1 背景
12.2 总体框架
12.3 系统实现
12.4 扩展性能测试
12.5 本章总结
第13章 综合实战3——移动通信信令监测与查询
13.1 分析与设计
13.2 实现代码
13.3 本章总结
第14章 高枕无忧——Hadoop容错
14.1 Hadoop的可靠性
14.2 Hadoop的SecondaryNameNode机制
14.3 Avatar机制
14.4 Avatar实战