Web文本分类中的几种阈值策略分析与比较

时间:2012-09-26 10:30:45
【文件属性】:

文件名称:Web文本分类中的几种阈值策略分析与比较

文件大小:121KB

文件格式:DOC

更新时间:2012-09-26 10:30:45

文本分类 阈值 分类算法

本文主要针对中文网页,分析比较了文本分类中的关于类别阈值的几种策略,分别是: 位置截尾法(RCut)、比例截尾法(PCut)、最优截尾法(SCut)以及改进型截尾法(RTCut),主要实验结果有: RTCut的效果最佳;PCut具有一定的复杂度,不适合在线文本处理;SCut具有一定的不稳定性;而Rcut性能最差, 并且使用英文文本和中文文本评测这几种阈值策略的结果是一致的。


网友评论