文件名称:网格与云平台上关联规则挖掘算法的比较研究-研究论文
文件大小:165KB
文件格式:PDF
更新时间:2024-06-08 09:44:58
Data mining Distributed Association Rule
由于涉及数据密集型和计算密集型特性,关联规则挖掘是一个耗时的过程。 为了挖掘大量数据并增强现有顺序关联规则挖掘算法的可扩展性和性能,开发了并行和分布式算法。 这些传统的并行和分布式算法基于同构平台,对网格和云等异类平台不利。 这就需要设计新的算法来解决良好的数据集分区和分布,负载均衡策略,这种异构系统中处理器之间的通信和同步技术的优化问题。 网格和云是用于分布式数据处理的新兴平台,并且已经在此类平台上提出了各种关联规则挖掘算法。 这篇调查文章结合了分布式系统的简要架构方面,具有比较感知能力的基于网格和基于云的关联规则挖掘算法的各种最新方法。 我们根据数据局部性,编程范例,容错,通信成本,数据集的分区和分布,对在这些体系结构上开发的关联规则挖掘算法的方法进行区分。 尽管它并不完整,无法涵盖所有算法,但是对于在分布式关联规则挖掘算法方向上工作的新研究人员而言,它可能非常有用。