svmcls文本分类程序(含C++源代码+语料库)完整版

时间:2013-05-20 13:48:04
【文件属性】:

文件名称:svmcls文本分类程序(含C++源代码+语料库)完整版

文件大小:19.86MB

文件格式:RAR

更新时间:2013-05-20 13:48:04

svmcls 文本分类 SVM

svmcls 2.0文本自动分类器支持中文和英文文档,特征选择方式包括全局和按类别选取,概率估算方法支持基于文档(布尔)统计和基于词频统计,支持三种特征加权方式,特征评估函数包括信息增益、互信息、期望交叉熵、X^2统计,文本证据权重,右半信息增益,分类方法包括支持向量机SVM和K近邻KNN,由李荣陆老师于2004年开发完成。 网上流传很多版本的svmcls文本分类程序,但几乎全部都是不能编译通过的,有些是缺少xercesc文件夹,有些是缺少xerces-c_2_2_0D.dll,有些是缺少分词程序和数据导致分词程序初始化失败,还有的缺少直接训练测试的语料库。 本人经过整理和编译测试,保证本压缩包解压后不仅有可以直接使用的.exe程序,而且所包含的源代码可以编译通过。可供广大学者研究使用。


网友评论

  • 谢谢提供分析,对我很有帮助哦
  • 特别好,中英文分类均可
  • 没用上,给个赞
  • 的确很完整~
  • 很详细,还有注释,适合学习
  • 为什么总是“分词程序初始化,请稍候... 分词程序初始化结束,耗时00:00:00 开始扫描训练文档,请稍候... ------------------error----------------- 训练文档的总数为0!”这样显示,请楼主帮忙,我的是txt文件
  • 不太懂c++,也不知道什么原因没运行起来
  • 中英文分类均可,语料库是中文的。代码有注释
  • 分类结果不显示,提示“试图执行系统不支持”
  • 水平有限,没看多懂
  • VS2012无法直接编译。
  • 不知道能不能运行,但是理解起来比较困难。
  • 太好了,正是我所需要的
  • 运行了,但是分析功能好像不能用
  • 资料不错,就是没有帮助文档
  • 做的效果很好、很全面
  • 数据文本挖掘非常有用
  • 很好的资源 可以通过编译,能运行,但是不明白
  • 代码需要调试,关闭预编译开关,其中也有一个小函数错误,不过很容易改,最好作者再提供一个使用说明书,方便大家学习。
  • 可以运行,但是代码注释太少,不利于阅读学习,而且测试结果的图形显示有些问题
  • 资料不错,就是没有帮助文档,看起来太费劲
  • 理解起来有些困难,需要自己多查文献资料,不过还是非常感谢楼主
  • 总是分词初始化失败啊,有人可以解决吗?
  • 很有用 感谢楼主
  • 太难了,缺少注释,能运行,但是不明白