文件名称:改进的PrefixSpan算法及其在序列模式挖掘中的应用 (2013年)
文件大小:752KB
文件格式:PDF
更新时间:2024-07-05 23:33:20
工程技术 论文
由于序列模式挖掘需要花费大量计算时间,并需要占用大量存储空间。减少计算量、节省存储空间开销成为序列模式挖掘的关键。因PrefixSpan算法不产生候选,而适当应用Bitmap数据结构可避免重复扫描数据库,基于此,本文提出了BM-PrefixSpan算法,用于序列模式挖掘,设计并构造了PFPBM(PrefixofFirstPositiononBitMap)表用于记录序列中的每个项在位图中第1次出现的位置。实验结果表明,BM-PrefixSpan算法综合了PrefixSpan和SPAM算法的优点,能够更快、更