text-classification:一个应用主题分布来表示文档的文本分类项目

时间:2024-06-26 00:29:29
【文件属性】:

文件名称:text-classification:一个应用主题分布来表示文档的文本分类项目

文件大小:9KB

文件格式:ZIP

更新时间:2024-06-26 00:29:29

Java

text-classification A text classification project that applied topics distribution to represent documents. ###项目结构 cn.ac.ict.textcalss.algorithm: 算法类 TopKSelector: 使用堆排序实现对TopK选择器,复杂度O(nlogk)。 cn.ac.ict.textcalss.classifier: 分类器 KNN: 实现了KNN算法 Rocchio: Rocchio算法是一种寻找最近类别中心作为类别的算法。 cn.ac.ict.textcalss.cluster: 聚类算法 Kmeans: 内容相关,如保存网页正文,分类等等 cn.ac.ict.textcalss.sim: 相似度计算 Similarity:相似度计算接口,要求所有实现该接口


【文件预览】:
text-classification-master
----src()
--------cn()
----README.md(1KB)

网友评论