实验1 安装Hadoop
一、实验目的
(1)掌握Linux虚拟机的安装方法。Hadoop在Linux操作系统上运行可以发挥最佳性能。鉴于目前很多读者正在使用Windows操作系统,因此,为了完成本书的后续实验,这里有必要通过本实验让读者掌握在Windows操作系统上搭建Linux虚拟机的方法。
(2)掌握 Hadoop 的伪分布式安装方法。很多读者并不具备集群环境,需要在一台机器上模拟一个小的集群,因此,需要通过本实验让读者掌握在单机上进行Hadoop的伪分布式安装方法。
二、实验平台
操作系统:Windows系统或者Ubuntu(推荐)。
虚拟机软件:推荐使用的开源虚拟机软件为VirtualBox。VirtualBox是一款功能强大的免费虚拟机软件,不仅具有丰富的特色、优异的性能,而且简单易用,可虚拟的系统包括Windows、Mac OS X、Linux、OpenBSD、Solaris、IBM OS2,甚至Android 4.0系统等。读者可以在Windows系统上安装VirtualBox软件,然后在VirtualBox上安装并且运行Linux操作系统。本次实验默认的Linux发行版为Ubuntu14.04。
三、实验内容和要求
1.下载相关软件
如果读者正在使用 Linux 操作系统,可以跳过本步,不需要下载相关软件;如果正在使用Windows操作系统,请下载VirtualBox软件和Ubuntu14.04镜像文件。
VirtualBox软件的下载地址:https://www.virtualbox.org/wiki/Downloads。
Ubuntu14.04的镜像文件下载地址:http://www.ubuntu.org.cn/download/desktop。
2.安装Linux虚拟机
如果读者正在使用Linux操作系统,则不需要了解Windows系统上的Linux虚拟机安装方法;如果正在使用Windows操作系统,则需要在Windows系统上安装Linux虚拟机。首先,在Windows系统上安装虚拟机软件VirtualBox软件;其次,在虚拟机软件VirtualBox上安装Ubuntu14.04操作系统。
3.进行Hadoop伪分布式安装
在Linux环境下完成伪分布式环境的搭建,并运行Hadoop自带的WordCount实例检测是否运行正常。
四、实验报告