文件名称:论文研究-一种有效的不确定数据概率频繁项集挖掘算法.pdf
文件大小:321KB
文件格式:PDF
更新时间:2022-08-11 12:12:04
不确定数据,可能世界,期望支持度,概率频繁项集
针对PFIM算法中频繁概率计算方法的局限性,且挖掘时需要多次扫描数据库和生成大量候选集的不足,提出EPFIM(efficient probabilistic frequent itemset mining) 算法。新提出的频繁概率计算方法能适应数据流等项集的概率发生变化时的情况;通过不确定数据库存储在概率矩阵中,以及利用项集的有序性和逐步删除无用事物来提高挖掘效率。理论分析和实验结果证明了EPFIM算法的性能更优。