实战Hadoop

更新时间：2018-12-27 17:42:04

最新章节：14.4 Avatar实战

封面

版权信息

前言

第1章神奇的大象——Hadoop

1.1 初识神象

1.2 Hadoop初体验

1.3 Hadoop族群

1.4 Hadoop安装

第2章 HDFS——不怕故障的海量存储

2.1 开源的GFS——HDFS

2.2 HDFS常用操作

2.3 HDFS API之旅

2.4 实战：用HDFS存储海量视频数据

第3章分久必合——MapReduce

3.1 MapReduce基础

3.2 样例分析：单词计数

3.3 MapReduce，你够了解吗

3.4 实战：倒排索引

第4章一张无限大的表——HBase

4.1 HBase简介

4.2 HBase入门

4.3 HBase操作演练

4.4 实战：使用MapReduce构建HBase索引

第5章更上一层楼——MapReduce进阶

5.1 简介

5.2 复合键值对的使用

5.3 用户定制数据类型

5.4 用户定制输入/输出格式

5.5 用户定制Partitioner和Combiner

5.6 组合式MapReduce计算作业

5.7 多数据源的连接

5.8 全局参数/数据文件的传递与使用

5.9 关系数据库的连接与访问

第6章 Hive——飞进数据仓库的小蜜蜂

6.1 Hive的组成

6.2 搭建蜂房——Hive安装

6.3 Hive的服务

6.4 HiveQL的使用

6.5 Hive示例

6.6 实战：基于Hive的Hadoop日志分析

第7章 Pig——一头什么都能吃的猪

7.1 Pig的基本框架

7.2 Pig的安装

7.3 Pig的使用

7.4 Pig Latin编程语言

7.5 实战：基于Pig的通话记录查询

第8章 Facebook的女神——Cassandra

8.1 洞察Cassandra的全貌

8.2 让Cassandra飞

8.3 Cassandra操作示例

8.4 Cassandra与MapReduce结合

第9章 Chukwa——收集数据的大乌龟

9.1 初识Chukwa

9.2 Chukwa架构与设计

9.3 Chukwa安装与配置

9.4 Chukwa小试

第10章一统天下——ZooKeeper

10.1 Zookeeper是个谜

10.2 ZooKeeper安装和编程

10.3 ZooKeeper演练：进程调度系统

10.4 实战演练：ZooKeeper实现NameNode自动切换

第11章综合实战1——打造一个搜索引擎

11.1 系统工作原理

11.2 网页搜集与信息提取

11.3 基于MapReduce的预处理

11.4 建立Web信息查询服务

11.5 系统优化

11.6 本章总结

第12章综合实战2——生物信息学应用

12.1 背景

12.2 总体框架

12.3 系统实现

12.4 扩展性能测试

12.5 本章总结

第13章综合实战3——移动通信信令监测与查询

13.1 分析与设计

13.2 实现代码

13.3 本章总结

第14章高枕无忧——Hadoop容错

14.1 Hadoop的可靠性

14.2 Hadoop的SecondaryNameNode机制

14.3 Avatar机制

14.4 Avatar实战

更新时间：2018-12-27 17:42:04