文件名称:Frequent-ItemSet-Mining-in-Parallel:这个项目的想法是建立一个音乐推荐系统,向用户推荐流派
文件大小:15KB
文件格式:ZIP
更新时间:2024-05-19 16:18:58
Java
并行进行频繁项目集挖掘 这个项目的想法是建立一个音乐推荐系统,向用户推荐各种流派。 它使用频繁项集挖掘算法Apriori来实现此目的。 它利用MapReduce框架实现并行数据处理。 目的是在Yahoo!中查找经常出现的体裁集。 音乐数据集。 因此,如果用户正在收听来自频繁类型集的一种类型,则系统将向用户推荐该集合中的其他类型。 雅虎! 音乐数据集代表Yahoo!的快照。 音乐社区对各种歌曲的偏爱。 该数据集包含180万名Yahoo!用户给出的13.6万首歌曲的超过7.17亿评级。 音乐服务。 数据是在2002年至2006年之间收集的。数据集中的每首歌曲都带有艺术家,专辑和流派属性。 给出了从类型ID到类型的映射以及类型层次。 最具挑战性的部分是利用Hadoop框架的固有功能来实现迭代算法。 更多实施细节... GenreSetGeneration.java文件执行预处理步骤以查找与用
【文件预览】:
Frequent-ItemSet-Mining-in-Parallel-master
----FrequentItemSetGen.java(5KB)
----DataSetGen.java(6KB)
----AprioriItemSetk.java(2KB)
----GenreSetGeneration.java(9KB)
----CandidateSetGen.java(8KB)
----AprioriItemSet2.java(10KB)
----README.md(3KB)