文件名称:论文研究-面向数据流的频繁模式挖掘研究.pdf
文件大小:1.08MB
文件格式:PDF
更新时间:2022-08-11 13:22:01
数据流,数据挖掘,数据流挖掘,频繁模式
数据流的无限性、高速性使得经典的频繁模式挖掘方法难以适用到数据流中。针对数据流的特点,对数据流中频繁模式挖掘问题进行了研究,提出了数据流频繁模式挖掘算法FP-SegCount。该算法将数据流分段并利用改进的FP-growth算法挖掘分段中的频繁项集,然后利用Count-Min Sketch进行项集计数。算法解决了压缩统计和计算快速高效的问题。通过实验分析,FP-SegCount算法是有效的。