集群模式得把MapReduce程序导出为jar文件,在集群中执行该文件 bin/hadoop wc.jar com.test.wc.WCRunner /input /output3
如果程序有错就得重新打包,重新上传到集群再运行。在本地上跑就会方便许多。但是需要配置一下环境。步骤如下:
1、把winutils.exe文件放到%HADOOP_HOME%的bin目录中
也就是本地Hadoop解压文件中的bin目录下。
2、设置HADOOP_HOME环境变量,需要根据此环境变量获取上面的文件
3、把hadoop.dll文件放到c:/windows/System32目录下
4、hadoop-2.6.0\share\hadoop\common\sources目录下hadoop-common-2.6.0-sources.jar文件中找到org\apache\hadoop\io\nativeio下NativeIO.java文件,复制到对应的Eclipse的project中, NativeIO.java文件还要在原来的包名下修改此文件的557行,替换为return true。
5、用管理员身份启动eclipse。