大数据技术原理与应用(第2版)
上QQ阅读APP看书,第一时间看更新

实验1 安装Hadoop

一、实验目的

(1)掌握Linux虚拟机的安装方法。Hadoop在Linux操作系统上运行可以发挥最佳性能。鉴于目前很多读者正在使用Windows操作系统,因此,为了完成本书的后续实验,这里有必要通过本实验让读者掌握在Windows操作系统上搭建Linux虚拟机的方法。

(2)掌握 Hadoop 的伪分布式安装方法。很多读者并不具备集群环境,需要在一台机器上模拟一个小的集群,因此,需要通过本实验让读者掌握在单机上进行Hadoop的伪分布式安装方法。

二、实验平台

操作系统:Windows系统或者Ubuntu(推荐)。

虚拟机软件:推荐使用的开源虚拟机软件为VirtualBox。VirtualBox是一款功能强大的免费虚拟机软件,不仅具有丰富的特色、优异的性能,而且简单易用,可虚拟的系统包括Windows、Mac OS X、Linux、OpenBSD、Solaris、IBM OS2,甚至Android 4.0系统等。读者可以在Windows系统上安装VirtualBox软件,然后在VirtualBox上安装并且运行Linux操作系统。本次实验默认的Linux发行版为Ubuntu14.04。

三、实验内容和要求

1.下载相关软件

如果读者正在使用 Linux 操作系统,可以跳过本步,不需要下载相关软件;如果正在使用Windows操作系统,请下载VirtualBox软件和Ubuntu14.04镜像文件。

VirtualBox软件的下载地址:https://www.virtualbox.org/wiki/Downloads。

Ubuntu14.04的镜像文件下载地址:http://www.ubuntu.org.cn/download/desktop。

2.安装Linux虚拟机

如果读者正在使用Linux操作系统,则不需要了解Windows系统上的Linux虚拟机安装方法;如果正在使用Windows操作系统,则需要在Windows系统上安装Linux虚拟机。首先,在Windows系统上安装虚拟机软件VirtualBox软件;其次,在虚拟机软件VirtualBox上安装Ubuntu14.04操作系统。

3.进行Hadoop伪分布式安装

在Linux环境下完成伪分布式环境的搭建,并运行Hadoop自带的WordCount实例检测是否运行正常。

四、实验报告