一种面向数据流的频繁项集挖掘算法 (2009年)

时间:2024-05-30 04:06:25
【文件属性】:

文件名称:一种面向数据流的频繁项集挖掘算法 (2009年)

文件大小:388KB

文件格式:PDF

更新时间:2024-05-30 04:06:25

自然科学 论文

与传统静态数据库中的数据不同,数据流是一个按时间到达的有序的项集,这使得经典的频繁项集挖掘算法难以适用到数据流中。根据数据流的特点,提出了数据流频繁项集挖掘算法FP-SegCount。该算法将数据流分段并利用改进的FP-growth算法挖掘分段中的频繁项集。然后,利用Count MinSketch进行项集计数。算法解决了压缩统计和计算快速高效的问题。通过和FP-DS算法的实验对比,FP-SegCount算法具有较好的时间效率。


网友评论