Hadoop学习记录（2）|HDFS shell命令|体系结构

HDFS的shell

调用文件系统（FS）shell命令使用hadoop fs的形式

所有的FS shell命令使用URI路径作为参数。

URI格式是scheme://authority/path。HDFS的scheme是hdfs，对本地文件系统，scheme是file。其中scheme和authority参数都是可选的，如果未加指定，就会使用配置中指定的默认scheme。

　例如：/parent/child可以表示成hdfs://namenode:namenodePort/parent/child，或者更简单的/parent/child（假设配置文件是namenode:namenodePort）

HDFS fs命令

Hadoop学习记录（2）|HDFS shell命令|体系结构 -help [cmd] //显示命令的帮助信息

Hadoop学习记录（2）|HDFS shell命令|体系结构 -ls(r) <path> //显示当前目录下所有文件

Hadoop学习记录（2）|HDFS shell命令|体系结构 -du(s) <path> //显示目录中所有文件大小

Hadoop学习记录（2）|HDFS shell命令|体系结构 -count[-q] <path> //显示目录中文件数量

Hadoop学习记录（2）|HDFS shell命令|体系结构 -mv <src> <dst> //移动多个文件到目标目录

Hadoop学习记录（2）|HDFS shell命令|体系结构 -cp <src> <dst> //复制多个文件到目标目录，不能用通配符，否则指向本地磁盘。

[root@h1 conf]# hadoop fs -cp /tmp/

/root/

cp: File does not exist: /tmp/hadoop-root-datanode.pid

cp: File does not exist: /tmp/hadoop-root-jobtracker.pid

cp: File does not exist: /tmp/hadoop-root-namenode.pid

cp: File does not exist: /tmp/hadoop-root-secondarynamenode.pid

cp: File does not exist: /tmp/hadoop-root-tasktracker.pid

cp: File does not exist: /tmp/hsperfdata_root

cp: File does not exist: /tmp/Jetty_0_0_0_0_50030_job_yn7qmk

cp: File does not exist: /tmp/Jetty_0_0_0_0_50060_task

.2vcltf
cp: File does not exist: /tmp/Jetty_0_0_0_0_50070_hdfs
w2cu08
cp: File does not exist: /tmp/Jetty_0_0_0_0_50075_datanode
hwtdwq
cp: File does not exist: /tmp/Jetty_0_0_0_0_50090_secondary
___y6aanv

cp: File does not exist: /tmp/ssh-pyNDMS3249

Hadoop学习记录（2）|HDFS shell命令|体系结构 -rm(r) //删除文件(夹)

Hadoop学习记录（2）|HDFS shell命令|体系结构 -put <localsrc> <dst> //本地文件复制到hdfs

Hadoop学习记录（2）|HDFS shell命令|体系结构 -copyFromLocal //同put

Hadoop学习记录（2）|HDFS shell命令|体系结构 -moveFromLocal //从本地文件移动到hdfs

Hadoop学习记录（2）|HDFS shell命令|体系结构 -get [-ignoreCrc] <src> <localdst> //复制文件到本地，可以忽略crc校验

Hadoop学习记录（2）|HDFS shell命令|体系结构 -getmerge <src> <localdst> //将源目录中的所有文件排序合并到一个文件中

Hadoop学习记录（2）|HDFS shell命令|体系结构 -cat <src> //在终端显示文件内容

Hadoop学习记录（2）|HDFS shell命令|体系结构 -text <src> //在终端显示文件内容

Hadoop学习记录（2）|HDFS shell命令|体系结构 -copyToLocal [-ignoreCrc] <src> <localdst> //复制到本地

Hadoop学习记录（2）|HDFS shell命令|体系结构 -moveToLocal <src> <localdst> 提示is not implemented yet 没有实现这个功能。

Hadoop学习记录（2）|HDFS shell命令|体系结构 -mkdir <path> //创建文件夹

Hadoop学习记录（2）|HDFS shell命令|体系结构 -touchz <path> //创建一个空文件

HDFS体系结构

Namenode

是整个文件系统的管理节点，它维护者整个文件系统的文件目录树，文件或目录的原信息和每个文件对应的数据块列表，并接收用户的操作请求。

文件包括：

fsimage：元数据镜像文件，存储某一时段。namnode内存元数据信息

dfs.name.dir 参数可以配置多个目录，保存多份。

<value>${hadoop.tmp.dir}/dfs/name,/data/dfs/name</value>

<description>Determines where on the local filesystem the DFS name node

should store the name table(fsimage). If this is a comma-delimited list

of directories then the name table is replicated in all of the

directories, for redundancy. </description>

</property>

edits：操作日志文件

保存事务性日志，如果上传成功了保存在里面，没上传成功信息将删除。

如何转移到fsimage呢？通过secondaryNameNode来完成的。

定期进行合并保存到fsimage，时间记录在fstime中。

fstime：保存最近一次chackpoint的时间

<name>fs.checkpoint.period</name>

<description>The number of seconds between two periodic checkpoints.

</description>

</property>

<name>fs.checkpoint.size</name>

<description>The size of the current edit log (in bytes) that triggers

a periodic checkpoint even if the fs.checkpoint.period hasn't expired.

</description>

</property>

DataNode

提供真实文件数据的存储服务

以文件块的形式存储，默认大小64M。

<name>dfs.block.size</name>

<description>The default block size for new files.</description>

</property>

不同于普通文件系统的是，HDFS中如果一个文件小于数据块大小，并不占用整个数据块存储空间，而是以实际的数据大小存储。

Replication，多副本，默认3个

<name>dfs.replication</name>

<description>Default block replication.

The actual number of replications can be specified when the file is created.

The default is used if replication is not specified in create time.

</description>

</property>

SecondaryNameNode

HA的一个解决方案，不支持热备，2.0版本支持。

执行过程：从Namenode上下载元数据信息（fsimage,edits），在本地保存并将其推送到Namenode，同时重置Namenode的edits。

默认安装在Namenode节点上，不安全！生成环境配置为独立服务器。

设置$HADOOP_HOME/conf/master中设置！

秒客网

Hadoop学习记录（2）|HDFS shell命令|体系结构

HDFS的shell

HDFS fs命令

HDFS体系结构

Namenode

DataNode

SecondaryNameNode

相关文章