文件名称:基于量值的频繁闭项集层次聚类算法 (2011年)
文件大小:262KB
文件格式:PDF
更新时间:2024-05-15 00:25:05
自然科学 论文
提出了基于量值的频繁闭项集层次聚类算法,首先通过用户web访问数据获取频繁闭项集;其次以频繁闭项集对簇进行初始化,并以打分的方式将用户指人唯一簇;再次按照簇标记自上而下生成簇树,并使用户访问向量分裂子簇;最后对簇树进行剪枝。实验结果表明,该算法能很好地预测用户web访问行为,其结果具有较优的结构特性,聚类数具有灵活性,可对海量用户数据进行挖掘。