大数据原理与技术
上QQ阅读APP看书,第一时间看更新

第2章 Hadoop大数据处理平台

2.1 Hadoop平台概述

2.2 Hadoop生态系统

2.3 Hadoop安装部署

2.4 华为FusionInsight HD安装部署

2.5 本章总结

练习题

Hadoop是Apache基金会开发的分布式计算平台,被公认为行业大数据标准开源软件,它可以在大规模计算机集群中提供海量数据的处理能力。由于其良好的性能,Hadoop大数据处理平台在大数据企业中应用广泛。

本章介绍了Hadoop的发展历程、应用特性和应用现状,对Hadoop生态系统中的各个组件做了简单的介绍。最后详细演示了Apache Hadoop以及华为基于Hadoop开发的大数据平台FusionInsight HD的安装部署。

学习目标

·了解Hadoop是什么。

·了解Hadoop生态系统中的重要组件。

·掌握Hadoop的安装部署方法。

·掌握华为FusionInsight HD的安装部署方法。