文件名称:论文研究-基于自身特征扩展的短文本分类方法.pdf
文件大小:1023KB
文件格式:PDF
更新时间:2022-08-11 16:20:27
短文本,稀疏,信号弱,扩展,离散度,相关度
短文本具有特征稀疏、描述概念信号弱等特点,传统方法对短文本进行分类很难取得较好结果。针对上述问题,提出了一种基于自身特征扩展的短文本分类方法SC-FE。该方法首先基于类内离散度从每个类中选取高类别指示性的特征组成特征空间;其次对样本的特征,在已选的特征空间中选取其相关度最大的特征加入短文本中进行扩充。在实际数据集上的实验结果表明,该方法可有效提高短文本的分类效果。