词频统计(基于hadoop集群,python实现)

时间:2023-08-01 14:15:32
【文件属性】:

文件名称:词频统计(基于hadoop集群,python实现)

文件大小:1.8MB

文件格式:RAR

更新时间:2023-08-01 14:15:32

python 并行化 hadoop wordcount

基于hadoop集群,用python写mapReduce实现单词统计,文件里包含python代码和操作步骤,适合初学者学习,我亲自测试,在ubuntu系统上,搭建的hadoop集群,能够运行出结果。


【文件预览】:
词频统计
----word1.txt(1.5MB)
----word3.txt(659KB)
----reducer.py(549B)
----word2.txt(1.36MB)
----词频统计(python代码).docx(658KB)
----mapper.py(191B)

网友评论