文件名称:论文研究-一种基于多桥映射的跨领域文本分类方法.pdf
文件大小:1.02MB
文件格式:PDF
更新时间:2022-08-11 15:39:06
跨领域分类,多桥映射,主题,文本分类
跨领域分类旨在利用已标记的源领域信息来为概率分布不同、未标记的目标领域训练一个精确的分类器。已有工作大多以文本主题为特征表现形式,并基于共享主题来建立领域间独有主题的映射关系,从而达到跨领域学习的目的。现实中领域间的连接可以是多角度的,但这种基于单一共享主题的映射方式,存在语义表示不完备和偏差性等问题,从而影响跨领域分类精度。基于此,提出一种基于多桥映射的跨领域分类方法,通过提取多重的共享主题和领域独有主题,并以多重共享主题为桥梁来建立领域独有主题之间的多重映射关系,从而实现跨领域的分类。在20Newsgroups和Reuters-21578数据集上的实验结果表明,与同类算法相比,所提算法在分类精度上具有优越性。