大数据技术原理与应用(第2版)
上QQ阅读APP看书,第一时间看更新

2.4 本章小结

Hadoop被视为事实上的大数据处理标准,本章介绍了Hadoop的发展历程,并阐述了Hadoop的高可靠性、高效性、高可扩展性、高容错性、成本低、运行在Linux平台上、支持多种编程语言等特性。

Hadoop目前已经在各个领域得到了广泛的应用,如雅虎、Facebook、百度、淘宝、网易等公司都建立了自己的Hadoop集群。

经过多年发展,Hadoop 生态系统已经变得非常成熟和完善,包括 Zookeeper、HDFS、MapReduce、HBase、Hive、Pig等子项目,其中HDFS和MapReduce是Hadoop的两大核心组件。

本章最后介绍了如何在 Linux 系统下完成 Hadoop 的安装和配置,该部分是后续章节实践环节的基础。