文件名称:论文研究-一种改进EM算法的跨领域情感分类方法.pdf
文件大小:987KB
文件格式:PDF
更新时间:2022-08-11 12:10:28
跨领域情感分类,EM算法,特征迁移
监督学习算法是当前进行文本情感分类的主要方法,往往要求训练集与测试集的数据分布相同,然而在实际情况下已标注数据与测试数据常常不属于同一个领域,这种数据分布差异导致文本情感分类准确率下降。针对这一问题,提出了一种基于EM算法的跨领域情感分类方法。首先从多个源领域结合目标领域生成一个情感倾向参考表;其次利用改进的EM算法参考该表迭代调节目标领域分类器的分类结果,直到该结果可以与参考表匹配;最后在公开数据集上与贝叶斯、SVM等主流分类方法进行对比实验。实验结果表明,该方法在一定程度上提高了跨领域情感分类的准确性。