文件名称:关联规则挖掘中改进型Diffsets算法
文件大小:97KB
文件格式:PDF
更新时间:2012-06-12 11:19:11
数据挖掘;关联规则挖掘;频繁项集挖掘;Diff set s
频繁项集挖掘是关联规则挖掘中至关重要的一步。对于稠密数据集的频繁项集挖掘,传统的挖掘算法往往产 生大量无用的中间结果,造成内存利用率的极大浪费,尤其是在支持度较低的情况下。Diff set s 算法通过引入“差集”的概 念,在一定程度上解决了挖掘过程中产生的大量中间结果与内存容量之间的矛盾。改进型Diff set s 算法是在原算法的基础 上,在差集运算过程中根据差集中所包含的事务标识个数进行递减排序,进一步减少了挖掘过程中产生的中间结果数量。 分析与实例表明,改进后的算法在执行过程中将占用更少的内存空间,加快了算法的收敛速度。