文件名称:WordFeature文本分类器
文件大小:1015KB
文件格式:ZIP
更新时间:2014-01-07 05:04:56
语料库处理 特征词 文本分类
实现的功能 一、语料库处理 词频率(TF),文档频率(DF)的统计。 二、特征词提取。 文档频率DF方法:DF大于指定的阀值而且在各分类之间具有差异性。 开方(χ2) 方法:衡量特征与类别的独立性 信息增益IG方法:衡量特征能够为分类系统带来多少信息,跟具体类别无关。 三、文本分类。 分类快速。 能对单个文件、目录、文件列表进行分类。
【文件预览】:
使用帮助.doc
filter.txt
Setup.msi
testdata.zip