文件名称:一种使用概念近似度约简的序列模式挖掘方法 (2009年)
文件大小:200KB
文件格式:PDF
更新时间:2024-06-04 22:55:53
自然科学 论文
传统的序列模式挖掘算法虽然能够挖掘所有的频繁序列,但在挖掘海量数据时可能因结果规模过于庞大而无法理解。基于概念格的序列模式挖掘有效地减少了中间序列的生成数量,在时间性能上具有一定的优越性,而概念格的结构特点也为自身的约简提供了便利。本文提出了近似概念的定义,首先对交易数据库建格,然后约简满足近似条件的概念,减少了频繁1-序列的数量,进而减少了总的频繁序列的数量。实验表明,在允许一定误差的情况下该方法提高了挖掘结果的可理解性和挖掘效率。