文件名称:小文件处理-Hadoop介绍
文件大小:12.67MB
文件格式:PPT
更新时间:2024-05-16 04:06:53
hadoop hadoop入门 大数据学习 大数据 大数据
小文件处理 小文件处理 Hadoop Archive :文件存档工具,高效将小文件放入HDFS块 SequenceFile:一些列二进制Key-Value组成,如果Key为文件名,Value为文件内容,可将大量小文件合为大文件。 CombineFileInputFormat:用于将多个文件合并成一个单独的split。 手动合并小文件,在存储到HDFS上,putMerge程序。