论文研究-一种快速网页检索结果聚类策略.pdf

时间:2022-10-02 14:01:28
【文件属性】:

文件名称:论文研究-一种快速网页检索结果聚类策略.pdf

文件大小:506KB

文件格式:PDF

更新时间:2022-10-02 14:01:28

论文研究

在网页聚类中,HAC(Hierarchical Agglomerative Clustering)算法和K-means算法都是经常用到的。但它们都有各自的不足。提出一种两阶段聚类方法。第一阶段利用HAC聚类算法对网络检索结果的标题进行聚类,第二阶段以第一阶段结果作为初始中心用K-means算法聚类标题和摘要取得比较合理的聚类结果。由于标题一般都比较短,可以大大减少HAC算法的运行时间。这样既满足网络检索对时间的要求又可以得到较好的聚类结果。


网友评论