小文件处理-Hadoop介绍

时间:2024-05-16 04:06:53
【文件属性】:

文件名称:小文件处理-Hadoop介绍

文件大小:12.67MB

文件格式:PPT

更新时间:2024-05-16 04:06:53

hadoop hadoop入门 大数据学习 大数据 大数据

小文件处理 小文件处理 Hadoop Archive :文件存档工具,高效将小文件放入HDFS块 SequenceFile:一些列二进制Key-Value组成,如果Key为文件名,Value为文件内容,可将大量小文件合为大文件。 CombineFileInputFormat:用于将多个文件合并成一个单独的split。 手动合并小文件,在存储到HDFS上,putMerge程序。


网友评论