文件名称:news-classifier:给定训练新闻数据集,可以对输入的测试新闻进行自动分类识别
文件大小:3.56MB
文件格式:ZIP
更新时间:2024-06-08 09:10:05
Java
news-classifier 给定训练新闻数据集,可以对输入的测试新闻进行自动分类识别 分类实现原理 总体上利用了余弦相似度计算的原理来计算文本相似度 其中的特征向量由训练数据集中的关键词构成,其中词语的寻找利用了中科大的ICTCLAS分词系统来做,提取其中的专业性的名词 利特征向量与标准向量进行余弦值的计算 使用方法 设定特征向量维数 给定训练新闻数据集,数量最后多一些,用于进行特征向量的计算 给定测试新闻数据集 输出分类结果
【文件预览】:
news-classifier-master
----NewsClassify()
--------data()
--------ICTCLAS_Sample()
--------News.java(2KB)
--------NewsClassifyTool.java(5KB)
--------Client.java(1KB)
--------Word.java(383B)
----.gitignore(574B)
----README.md(612B)
----.gitattributes(378B)