文件名称:使用 Apriori 和 FP-Growth 算法评估频繁项集挖掘平台-研究论文
文件大小:374KB
文件格式:PDF
更新时间:2024-06-29 14:56:10
论文研究
随着海量的复杂异构数据从任何地点、任何时间、任何设备涌入,无可否认,大数据时代已经来临。 大数据作为下一代智能系统的颠覆性技术的出现,带来了如何在短时间内、预算有限、数据生成率高的情况下提取和利用从数据中获得的知识的许多问题。 公司认识到大数据可以用来做出更准确的预测,并且可以在适当的关联规则挖掘算法的帮助下用于增强业务。 为了帮助这些组织,根据他们的数据集使用哪种软件和算法更适合他们,我们比较了最著名的三个基于 MapReduce 的软件 Hadoop、Spark、Flink 在两种广泛使用的算法 Apriori 和 Fp-Growth 在不同规模的数据集上。