文件名称:词频统计(基于hadoop集群,python实现)
文件大小:1.8MB
文件格式:RAR
更新时间:2023-08-01 14:15:32
python 并行化 hadoop wordcount
基于hadoop集群,用python写mapReduce实现单词统计,文件里包含python代码和操作步骤,适合初学者学习,我亲自测试,在ubuntu系统上,搭建的hadoop集群,能够运行出结果。
【文件预览】:
词频统计
----word1.txt(1.5MB)
----word3.txt(659KB)
----reducer.py(549B)
----word2.txt(1.36MB)
----词频统计(python代码).docx(658KB)
----mapper.py(191B)