文件名称:基于界标窗口的数据流频繁项集挖掘算法的改进* (2014年)
文件大小:394KB
文件格式:PDF
更新时间:2024-05-12 08:57:52
自然科学 论文
挖掘数据流中频繁项集的技术是当前研究的热点之一.笔者借鉴数据模型FP-tree的结构,提出改进的适应挖掘数据流完全频繁项集的方法:FP-NEW.算法预处理阶段保存生成的潜在频繁项并作为构造NFP-tree中的记录输入,用户可以通过设置时间权重等策略对存储结果进行剪枝处理,最终经过迭代挖掘界标窗口中的完全频繁项集.实验证明算法能够适应数据流频繁项集的挖掘,并且在时空效率以及挖掘准确性上有一定优势.