论文研究-快速混合Web文档聚类.pdf

时间:2022-09-26 12:34:23
【文件属性】:

文件名称:论文研究-快速混合Web文档聚类.pdf

文件大小:584KB

文件格式:PDF

更新时间:2022-09-26 12:34:23

论文研究

提出了一种使用后缀树聚类算法优化K-means文档聚类初始值的快速混合聚类方法STK-means。该方法首先构建文档集的后缀树模型,使用后缀树聚类算法识别初始聚类、提取K-means聚类算法初始值中心值。然后,把后缀树模型的节点映射到M维向量空间模型中的特征项,利用TF-IDF方案计算基于短语的文档向量特征值。最后,使用K-means算法产生聚类结果。实验结果表明该方法优于传统K-means聚类算法和后缀树聚类算法,并具备了这些算法聚类速度快的优点。


网友评论