基于STC的中文文本聚类算法

时间:2012-05-05 17:27:44
【文件属性】:

文件名称:基于STC的中文文本聚类算法

文件大小:424KB

文件格式:PDF

更新时间:2012-05-05 17:27:44

聚类 STC 算法

提出了一种文档聚类方法,对用户的检索结果中类似的文档进行聚类,提供目录结 构,辅助用户浏览检索结果.首先分析了现有的文本聚类方法,讨论了它们的优势和不足,然后 提 出了 基 于后缓树的中文文本聚类算法,并详细描述了该算法的原理和构造使用过程,及在算 法 实现 的 过程中遇到的关键问题及解决方案


网友评论

  • 算法看起来还是有可行性的,不错
  • STC算法使用比较少,代码通用性不强