【文件属性】:
文件名称:papjuice:通过 Python Goggles 实现 MapReduce
文件大小:15KB
文件格式:ZIP
更新时间:2021-07-01 23:27:44
Python
#PapJuice
通过 Python Goggles 实现 MapReduce
灵感
学习和实践 MapReduce(基于 Hadoop)和 MultiProcessing 的概念。
计划
我们将分两个阶段解决这个问题:
创建单进程解决方案。
将其转换为多进程。
步骤 1 确保我们有正确的解决方案,我们可以根据步骤 2 进行验证。
通过陈词滥调的 MapReduce 概念 - 字数统计
考虑我们有三个文档,我们想要找到其中唯一单词的总计数。 我们可以使用 MapReduce 来利用分布式计算。
如果我们要使用生产级 MapReduce 解决方案,我们将使用 Hadoop 或 Compute,但由于我们的尝试是学习 MultiProcessing,因此我们将创建自己的 MapReduce 解决方案。 这样,我们也了解了 MapReduce 的各个组件。
MapReduce 由五
【文件预览】:
papjuice-master
----docs()
--------multiprocessing.md(17KB)
--------datanode.md(7KB)
----LICENSE(1KB)
----data_node.py(1KB)
----.gitignore(675B)
----README.md(5KB)
----pap.py(5KB)