文件名称:文本分类程序
文件大小:9KB
文件格式:ZIP
更新时间:2015-05-02 15:44:25
文本分类
完整的文本分类程序,分词,去停用词,提取文本特征等。
【文件预览】:
textcluster
----WawaCluster.java(1KB)
----input.txt(606B)
----Tokeniser.java(1KB)
----ITokeniser.java(204B)
----StopWordsHandler.java(1KB)
----TFIDFMeasure.java(7KB)
----TermVector.java(1KB)
----WawaKMeans.java(6KB)
----Program.java(3KB)