文件名称:在线方面知识指导下的产品方面提取
文件大小:1.47MB
文件格式:PDF
更新时间:2024-04-17 10:07:24
Aspect extraction; Product aspect; Topic
基于方面的观点挖掘中最具挑战性的问题之一是方面提取,它旨在识别描述产品方面的表达式(称为方面表达式)并对领域特定的同义词表达进行分类。 尽管以前已经提出了许多方面提取方法,但其中很少有方法被用来提高所生成方面的可解释性。 现有方法要么在没有适当分类的情况下生成多个细粒度方面,要么对语义上不相关的产品方面进行分类(例如,通过无监督的主题建模)。 在本文中,我们首先检查了有关产品方面提取的先前研究。 为了克服现有方法的局限性,然后提出了两个新颖的半监督模型,用于产品方面的提取。 更具体地,所提出的方法首先从易于在电子商务网站上获得的详细产品描述中提取播种方面和相关术语。 接下来,根据这些播种方面对产品评论进行重新分组,以便为主题建模构建更有效的文本上下文。 最后,开发了两个新颖的半监督主题模型来提取人类可理解的产品方面。 对于第一个提出的主题模型,即细粒度标记的LDA(FL-LDA),使用播种方面来指导模型发现与这些播种方面相关的词。 对于第二种模型,即统一细粒度标记的LDA(UFL-LDA),我们合并了未标记的文档以扩展FL-LDA模型,以便提取与播种方面相关的词或客户评论中的其他高频词。 我们的实验结果表明,所提出的方法优于最新方法。 (C)2014 ENevier BV保留所有权利。