实验globStatus的时候遇到问题,先贴代码
package HDFS;
import java.io.*;
import java.net.URI;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.fs.FileStatus;
import org.apache.hadoop.fs.FileUtil;
public class GlobStatus {
public static void main(String[] args) throws Exception {
String uri = args[0];
Configuration conf = new Configuration();
FileSystem fs = FileSystem.get(URI.create(uri), conf);
Path[] paths = new Path[args.length];
for ( int i = 0; i < paths.length; ++i) {
System.out.println("args["+i+"]="+args[i]);//这句是后来加的
paths[i] = new Path(args[i]);
}
System.out.println(paths[0].toString());//这句也是后来调试加的
FileStatus[] status = fs.globStatus(paths[0]);
//这里的判空是有必要的,不然如果没获取到任何文件或目录时会报出NullPointerException,不知道为什么教程都没写 if( status != null) {System.out.println(status.length);Path[] listedPaths = FileUtil.stat2Paths(status);for ( Path p : listedPaths ) {System.out.println(p);}}}}本来是想传个参数“/*”进去,打印出当前hadoop文件系统下的/input,/output(就这俩,以前加的),但是执行结果却是什么也没有,很奇怪于是检查参数是否正常传入,就加入了上述代码中的两行红色代码,再执行结果这样
$HADOOP_HOME/bin/hadoop HDFS.GlobStatus /*
args[0]=/Applications
args[1]=/Library
args[2]=/Network
args[3]=/System
args[4]=/Users
args[5]=/Volumes
args[6]=/bin
args[7]=/cores
args[8]=/dev
args[9]=/etc
args[10]=/home
args[11]=/installer.failurerequests
args[12]=/net
args[13]=/private
args[14]=/sbin
args[15]=/tmp
args[16]=/usr
args[17]=/var
/Applications
原来命令行的参数/*在传入的时候并非当作字符串“/*”传入了,而是直接命令行传入之前就做了通配符展开所以我的命令行执行指令相当于这样$HADOOP_HOME/bin/hadoop HDFS.GlobStatus /Applications /Library /NetWork ...
于是上网查找,找到一段描述
默认情况下,操作系统对星号*的处理,是当做通配符。 如果想给main函数传普通的星号的话,应该用"*"。
来自:http://www.th7.cn/Program/java/201510/621784.shtml
然后把命令改成
$HADOOP_HOME/bin/hadoop HDFS.GlobStatus"/*"
正常打印出想要的结果。