文件名称:MyMapReduce
文件大小:298KB
文件格式:ZIP
更新时间:2024-04-11 05:49:50
Java
mapreduce-Chi-Che-Fang #环境:已安装Windows + Java SDK 8 #Applications:WordCount,Grep,URLCount(有关更多详细信息,请参阅MapReduce论文) 怎么跑? 切换到该项目的根目录(例如cd / mapreduce-Cih-Che-Fang),并确认路径中不包含“空白” 在Windows操作系统(安装了JDK并设置了JDK环境变量)上执行run_test.bat,并将所有文件输出到“ output_ [APP_NAME]”文件夹。 (例如,wordcount示例将结果输出到output_wordcount文件夹,grep示例将输出结果到output_grep文件夹) 在控制台上查看测试结果,它将告诉您输出是否等于Spark输出。 日志如下: C:\ Users \ user \ 532-project1
【文件预览】:
MyMapReduce-main
----input_wordcount()
--------doc5.txt(23B)
--------doc4.txt(30B)
--------doc1.txt(898B)
--------doc3.txt(17B)
--------doc2.txt(131B)
----user_config_urlcount(194B)
----input_grep()
--------doc5.txt(23B)
--------doc4.txt(30B)
--------doc1.txt(898B)
--------doc3.txt(17B)
--------doc2.txt(81B)
----src()
--------Master()
--------Utils()
--------Apps()
--------Slave()
----user_config_wordcount(198B)
----bin()
--------.gitignore(46B)
----.classpath(348B)
----output_wordcount()
--------out.0(430B)
--------out.1(472B)
--------spark_out.0(430B)
--------spark_out.1(472B)
----README.md(2KB)
----.project(370B)
----intermediate()
--------tmp.1(456B)
--------tmp.0(0B)
----input_urlcount()
--------page1.txt(824B)
--------page2.txt(79B)
--------page4.txt(59B)
--------page3.txt(79B)
--------page5.txt(55B)
----output_grep()
--------out.0(0B)
--------out.1(358B)
--------spark_out.0(0B)
--------spark_out.1(358B)
----output_urlcount()
--------out.0(154B)
--------out.1(132B)
--------spark_out.0(154B)
--------spark_out.1(132B)
----sources.txt(1KB)
----run_test.bat(1KB)
----local_refresh.bat(112B)
----docs()
--------output_wordcount()
--------output_grep()
--------Docuement.pdf(296KB)
--------output_urlcount()
----SparkValidation()
--------spark_urlcount.py(512B)
--------spark_grep.py(559B)
--------spark_wordcount.py(581B)
----user_config_grep(173B)