基于文本内容的自动文本聚类

时间:2014-04-24 07:31:18
【文件属性】:

文件名称:基于文本内容的自动文本聚类

文件大小:554KB

文件格式:PDF

更新时间:2014-04-24 07:31:18

基于文本内容的自动文本聚类技术作为文本信息挖掘技术中的核心技术之一,其目标是 将文档集合分成若干个簇,要求同一簇内文档内容的相似度尽可能的大,而不同簇之间的相 似度尽可能的小。 本文以中文文本作为文本聚类的挖掘对象,对文本集进行了中文文本预处理、文本聚类。 按照文中的方法步骤,设计了一个系统,实现了文本聚类的功能。


网友评论

  • 还没用,先研究一下
  • 非常好,解决了大问题
  • 学习了一下,还是很有帮助
  • 学习了一下,还是很有帮助
  • 可以使用,鉴定完毕
  • 没有界面,不适合我
  • 这篇文章主要写了应用K-MEANS算法进行文本聚类并提供了对开发出的工具的测试,但是没有什么创新性