文件名称:大数据量下的Apriori改进算法及在weka平台的实现
文件大小:2.45MB
文件格式:PDF
更新时间:2015-10-30 06:17:53
大数据 数据挖掘 weka 关联规则算法
对于数据库中数据量较大的情况,Apriori算法在搜索频繁项集和挖掘强关联规 则的过程中,会导致算法扫描数据库和挖掘频繁项集过程中系统IO压力过大,算法性能较低等不足。文章提出了一种改进的快速Apriori算法,通过一次全局扫描来验证从样本中发现的模式,来压缩迭代次数。如果一个k-项集的(k-1)-子集不在Lk-1中,则该候选不可能是频繁的。