Hadoop基础教程-第2章 Hadoop快速入门(2.2 Hadoop下载与安装)

时间:2023-01-20 05:23:18

2.1 Hadoop下载与安装

2.1.1 官网下载

打开Apache Hadoop官方网址http://hadoop.apache.org/

Hadoop基础教程-第2章 Hadoop快速入门(2.2 Hadoop下载与安装)

单击左侧菜单“Releases”将打开发行版页面http://hadoop.apache.org/releases.html

Hadoop基础教程-第2章 Hadoop快速入门(2.2 Hadoop下载与安装)

单击2.7.3版本下“binary”链接,将进入该版本的下载页面
Hadoop基础教程-第2章 Hadoop快速入门(2.2 Hadoop下载与安装)
单击最上方的建议链接:
We suggest the following mirror site for your download:
http://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-2.7.3/hadoop-2.7.3.tar.gz

可以使用迅雷或QQ旋风等多线程下载工具来下载,支持断点续传。成功下载后得到hadoop-2.7.3.tar.gz压缩文件,204M。请检查压缩包是否204M,浏览器下载的话可能会中断。

2.1.2 上传至虚拟机

Hadoop基础教程-第2章 Hadoop快速入门(2.2 Hadoop下载与安装)

通过ll或ls命令可以查看到已经上传到虚拟机node1上的hadoop-2.7.3.tar.gz压缩文件

Hadoop基础教程-第2章 Hadoop快速入门(2.2 Hadoop下载与安装)

2.1.3 解压缩

按照《1.7 目录规划》http://blog.csdn.net/chengyuqiang/article/details/71512953节规划,需要将Hadoop安装到/opt目录下。
通过下面命令直接将hadoop-2.7.3.tar.gz解压缩到/opt目录下
tar -zxvf hadoop-2.7.3.tar.gz -C /opt

[root@node1 ~]# tar -zxvf hadoop-2.7.3.tar.gz -C /opt

Hadoop基础教程-第2章 Hadoop快速入门(2.2 Hadoop下载与安装)

通过cd /opt/hadoop-2.7.3命令切换到hadoop根目录,然后通过ll命令查看

Hadoop基础教程-第2章 Hadoop快速入门(2.2 Hadoop下载与安装)

2.1.4 目录结构分析

如上图Hadoop的目录结构:

  1. bin :Hadoop 最基本的管理脚本和使用脚本所在目录,这些脚本是sbin目录下管理脚本的基础实现,用户可以直接使用这些脚本管理和使用Hadoop 。
  2. etc :Hadoop 配置文件所在的目录,包括core-site.xml 、hdfs-site.xml 、mapred-site.xml 等从Hadoop 1.0 继承而来的配置文件和yarn-site.xml 等Hadoop 2.0 新增的配置文件。
  3. include :对外提供的编程库头文件(具体动态库和静态库在lib 目录中),这些头文件均是用C++ 定义的,通常用于C++ 程序访问HDFS 或者编写MapReduce 程序。
  4. lib :该目录包含了Hadoop 对外提供的编程动态库和静态库,与include目录中的头文件结合使用。
  5. libexec :各个服务对应的shell 配置文件所在目录,可用于配置日志输出目录、启动参数(比如JVM 参数)等基本信息。
  6. sbin :Hadoop 管理脚本所在目录,主要包含HDFS 和YARN 中各类服务的启动/ 关闭脚本。
  7. share :Hadoop 各个模块编译后的jar 包所在目录 。