论文研究-基于Spark的并行关联规则挖掘算法研究综述.pdf

时间:2022-09-27 09:05:50
【文件属性】:

文件名称:论文研究-基于Spark的并行关联规则挖掘算法研究综述.pdf

文件大小:968KB

文件格式:PDF

更新时间:2022-09-27 09:05:50

论文研究

关联规则挖掘是数据挖掘的一个重要分支,但随着数据的快速增长,传统关联规则挖掘算法不能很好地适应大数据的要求,需要在分布式、并行计算的平台上寻找突破。Spark是专门为大数据处理而设计的一个适合迭代运算的并行计算模型,相比MapReduce具有更高效、充分利用内存、更适合迭代计算和交互式处理的优点。对已有的基于Spark的并行关联规则挖掘算法进行了分类和综述,并总结了各自的优缺点和适用范围,为下一步的研究提供参考。


网友评论