WordFeature文本分类器

时间:2014-01-07 05:04:56
【文件属性】:

文件名称:WordFeature文本分类器

文件大小:1015KB

文件格式:ZIP

更新时间:2014-01-07 05:04:56

语料库处理 特征词 文本分类

实现的功能 一、语料库处理 词频率(TF),文档频率(DF)的统计。 二、特征词提取。 文档频率DF方法:DF大于指定的阀值而且在各分类之间具有差异性。 开方(χ2) 方法:衡量特征与类别的独立性 信息增益IG方法:衡量特征能够为分类系统带来多少信息,跟具体类别无关。 三、文本分类。 分类快速。 能对单个文件、目录、文件列表进行分类。


【文件预览】:
使用帮助.doc
filter.txt
Setup.msi
testdata.zip

网友评论

  • 很好的变 希望继续努力
  • 还要下载中科院的分词,感觉没什么大用
  • 谢谢楼主,不是源码不好
  • 程序过期了。。。。。
  • 我需要的是代码,不过还是谢谢楼主分享了
  • 谢谢楼主的分享,不过还是有点小问题
  • 如果有源代码就好了,谢谢分享
  • 是一个安装文件,可安装运行,且包含测试数据,多谢楼主分享。