文件名称:基于特征信息增益权重的文本分类算法 (2006年)
文件大小:256KB
文件格式:PDF
更新时间:2024-06-03 05:06:11
工程技术 论文
为了在分类精度不受损失的情况下提高训练速度,设计了3种基于信息增益(informationgain,简称IG)特征权重的分类算法,分别被命名为:IG-C1、IG-C2、IG-C。它们根据特征对1G贡献的大小及在新文本中出现的次数进行分类。这3种算法都具有较低的时间复杂度和实现简单的特点。实验结果表明,其中IG-C的分类效果最为理想。