论文研究-LSI_LDA:一种混合特征降维方法.pdf

时间:2022-08-11 15:23:00
【文件属性】:

文件名称:论文研究-LSI_LDA:一种混合特征降维方法.pdf

文件大小:1.67MB

文件格式:PDF

更新时间:2022-08-11 15:23:00

文本分类,特征降维,潜在语义索引,潜在狄利克雷分配

LDA没有考虑到数据输入,在原始输入空间上对所有词进行主题标签,因对非作用词同样分配主题,致使主题分布不精确。针对其不足,提出了一种结合LSI和LDA的特征降维方法,预先采用LSI将原始词空间映射到语义空间,再根据语义关系筛选出原始特征集中关键的特征,最后通过LDA模型在更小、更切题的文档子集上采样建模。对复旦大学中文语料进行文本分类,新方法的分类精度较单独使用LDA模型的效果提高了1.50%。实验表明提出的LSI_LDA模型在文本分类中有更好的分类性能。


网友评论