下载一个 hadoop-eclipse-plugin-*.jar的eclipse插件,并放在plugins目录下
重启eclipse
打开视象,找“大象”
连接HDFS
success
编程准备:
1.建个java项目
在项目下建个文件夹,如lib,导入所需的jar包。然后选中所有的jar包builtpath
mapreduce-client和hdfs是关键的,还有yarn-client
IKAnalyzer用于分词
MR流程:1.切分(不写代码);2.mapper(开始写代码)3.
mapper须继承父类Mapper
重写map方法