基于存储改进的分区并行关联规则挖掘算法下载

【文件属性】：

文件名称：基于存储改进的分区并行关联规则挖掘算法

文件大小：1.24MB

文件格式：PDF

更新时间：2024-05-20 07:01:04

关联规则大数据候选集

针对现有算法存储结构简单、生成大量冗余的候选集、时间和空间复杂度高、挖掘效率不理想的情况，为了进一步提高关联规则算法挖掘频繁集的速度，优化算法的执行性能，提出基于内存结构改进的关联规则挖掘算法。该算法基于Spark分布式框架，分区并行挖掘出频繁集，提出在挖掘过程中利用布隆过滤器进行项目存储，并对事务集和候选集进行精简化操作，进而达到优化挖掘频繁集的速度、节省计算资源的目的。算法在占用较少内存的条件下，相比于YAFIM和MR-Apriori算法，在挖掘频繁集效率上有明显的提升，不但能较好地提升挖掘速度，降低内存的压力，而且具有很好的可扩展性，使得算法可以应用到更大规模的数据集和集群，从而达到优化算法性能的目的。

立即下载

秒客网

基于存储改进的分区并行关联规则挖掘算法

网友评论

相关文章