文件名称:k-means文本聚类 java源码
文件大小:9KB
文件格式:RAR
更新时间:2015-07-04 08:44:36
lk-means 聚类 java 源码
k-means中文文本聚类java源码,包括对文本tf,idf的计算,文本相似度计算
【文件预览】:
textcluster
----TermVector.java(1KB)
----input.txt(606B)
----Tokeniser.java(1KB)
----ITokeniser.java(204B)
----WawaCluster.java(1KB)
----TFIDFMeasure.java(7KB)
----StopWordsHandler.java(1KB)
----WawaKMeans.java(6KB)
----Program.java(3KB)