mapreduce如何自定义reduce输出的文件名
-
跟随源码找到设置输出文件的方法
org.apache.hadoop.mapreduce.lib.output.FileOutputFormat.getDefaultWorkFile(TaskAttemptContext, String)
继续跟进这个方法
org.apache.hadoop.mapreduce.lib.output.FileOutputFormat<K, V>
-
发现是使用此方法返回的文件路径,我们只需要自定义一个类继承TextOutputFormat,然后重写getDefaultWorkFile(job, extension)方法,如下
在job中设置自定义输出类
-
效果