文件名称:基于堆栈模型的数据挖掘算法研究 (2002年)
文件大小:218KB
文件格式:PDF
更新时间:2024-06-03 20:10:11
自然科学 论文
基于关联规则的数据挖掘算法的时空耗费关键主要有两个:一个是需要对海量事务数据库进行多趟扫描.另一个是在JOIN运算中产生了大量潜在频繁项集.提出了利用堆栈模型动态生成频繁项集,每次用上次生成结果来产生新的频繁项集,边产生边判断,把满中最小信任度的频繁项集存放于链表中,减少了JOIN运算产生的多余项所占用的空间耗费.利用事务压缩法来减少事务库数据规模,对每次扫描后的事务数据库进行优化,从而达到减少空间耗费和扫描规模,提高效率的目的。