文件名称:基于贝叶斯及KNN算法的newsgroup文本分类器
文件大小:143KB
文件格式:RAR
更新时间:2015-04-17 17:05:57
数据挖掘 贝叶斯算法 KNN算法 newsgroup文档集 文本分类器
基于贝叶斯及KNN算法的newsgroup文本分类器,eclipse工程 程序运行方法:用eclipse打开工程,并将newsgroup文档集解压到 F:\DataMiningSample\orginSample目录下,同时在F:\DataMiningSample\ 下建好如附件“F盘DataMiningSample目录下的数据子目录结构”图中的目录, 停用词表也放在"F:/DataMiningSample/目录下,即可运行eclipse工程。程序 会依次执行数据预处理、贝叶斯分类、KNN分类,输出10次交叉验证实验的分类 结果、准确率统计及混淆矩阵。