Hadoop-2.0 目录简介
一、目录结构
将下载的压缩包解压:
解压后文件夹如下:
二、各文件夹目录结构
1、bin:Hadoop2.0的最基本管理脚本和使用脚本所在目录。这些脚本是sbin目录下管理脚本的基础实现,我们可以直接用这些脚本管理和使用Hadoop。
2、etc:这个目录里的文件只要接触过Hadoop的人都很熟悉。Hadoop配置文件目录。首先是从Hadoop1.0继承来的三个文件core-site.xml、hdfs-site.xml、mapred-site.xml,然后还有一个Hadoop2.0新增的一个配置文件yarn-site.xml。
3、include:这个是对外提供的编程库头文件,具体动态库和静态库在lib目录里。这些头文件均用C++定义的。学过C++语言的人可以用C++语言访问HDFS或者编写MapReduce程序。
(没错这就是咱们熟悉的.h文件。)
4、lib:该目录包含了Hadoop对外提供的编程动态库和静态库,与include目录里的头文件结合使用。
5、libexec:这个是各个服务对应的Shell配置文件所在目录,可用于配置日志输出目录、启动参数(比如JVM参数)等基本信息。
6、sbin:Hadoop管理脚本所在目录,主要包括HDFS和YARN中各类服务的启动和关闭脚本。
7、share:Hadoop各个模块编译后的JAR包所在目录。
在这个目录:hadoop-2.4.0\share\doc\hadoop\api\index.html可以查看API。