文件名称:ReduceSideJoin:MapReduce 程序实现Reduce 侧连接技术
文件大小:14KB
文件格式:ZIP
更新时间:2024-06-27 06:03:35
Java
减少侧连接 MapReduce 程序来实现减少边连接技术。 ##Data set 描述:Book-Crossing 数据集由 2 个表组成。 ##BX-Books:它为我们提供了有关书籍的详细信息,例如书名、书籍作者、出版年份、出版商、图像 URL 和 ISBN。 在这里,ISBN 将作为一本书的唯一代码。 无效的 ISBN 已从数据集中删除。 还给出了链接到封面图像的 URL,以三种不同的形式出现( Image-URL-S 、 Image-URL-M 、 Image-URL-L ),即小、中、大。 这些 URL 指向亚马逊网站。 #BX-Book-Ratings:它包含图书评级信息。 评级要么明确表示为 1-10 的等级(较高的值表示较高的赞赏)或隐含表示为 0。 ##目标: 根据排名找出每年出版了多少本书。
【文件预览】:
ReduceSideJoin-master
----.project(373B)
----README.md(901B)
----bin()
--------com()
----.settings()
--------org.eclipse.jdt.core.prefs(587B)
----src()
--------com()
----output()
--------part-r-00000(760B)
--------_SUCCESS(0B)
--------._SUCCESS.crc(8B)
--------.part-r-00000.crc(16B)
----input()
--------books.csv(5KB)
--------ratings.csv(513B)
----.classpath(1KB)