文件名称:利用SVM进行文本分类并研究特征选择对文本分类的影响
文件大小:714KB
文件格式:PDF
更新时间:2015-04-26 06:09:42
svm 文本分类
支持向量机是一个具有多类分类能力的非线性分类器。在实际应用中,有可 能出现不同类别样本数目相差很大的情况,比如在解决故障检测等分类问题时,c—sVM训练的分类错误总偏向于样本数较少的类别,因而影响了分类的精确性。为提高精确性,提出了一种优化算法,在训练过程中针对不同类样本,采用不同的权值来优化训练过程,按正负类样本在总样本中所占的比例,加大样本数较少的类别权值,降低样本数较大的类别权值来实现两类样本间的均衡。实验结果表明该方法对两类样本数目相差很大的问题是有效的。