文件名称:文本聚类算法的质量评价 (2006年)
文件大小:407KB
文件格式:PDF
更新时间:2024-06-14 22:49:04
自然科学 论文
利用标准的分类测试集合进行聚类质量的量化评价,选择了k―Means聚类算法、STC(后缀树聚类)算法和基于Ant的聚类算法进行了实验对比.实验结果分析表明,STC聚类算法由于在处理文本时充分考虑了文本的短语特性,其聚类效果较好;基于Ant的聚类算法的结果受参数输入的影响较大;在Ant聚类算法中引入文本特性可以提高聚类结果的质量.
文件名称:文本聚类算法的质量评价 (2006年)
文件大小:407KB
文件格式:PDF
更新时间:2024-06-14 22:49:04
自然科学 论文
利用标准的分类测试集合进行聚类质量的量化评价,选择了k―Means聚类算法、STC(后缀树聚类)算法和基于Ant的聚类算法进行了实验对比.实验结果分析表明,STC聚类算法由于在处理文本时充分考虑了文本的短语特性,其聚类效果较好;基于Ant的聚类算法的结果受参数输入的影响较大;在Ant聚类算法中引入文本特性可以提高聚类结果的质量.