文件名称:中文网页自动分类器
文件大小:173KB
文件格式:RAR
更新时间:2010-12-16 13:47:49
ictclas knn struts2 中文分词 文本分类
利用knn算法实现了一个中文网页自动分类器, 包括网页预处理,ictclas中文分词,基于tf-idf的文本特征表示,基于df的特征选取和基于knn的分类算法,最后通过struts2框架web发布
文件名称:中文网页自动分类器
文件大小:173KB
文件格式:RAR
更新时间:2010-12-16 13:47:49
ictclas knn struts2 中文分词 文本分类
利用knn算法实现了一个中文网页自动分类器, 包括网页预处理,ictclas中文分词,基于tf-idf的文本特征表示,基于df的特征选取和基于knn的分类算法,最后通过struts2框架web发布