1. 摘要
情感原因提取(Emotion cause extraction, ECE)是一项旨在提取文本中某些情感背后潜在原因的任务,由于其广泛的应用,近年来受到了广泛的关注。但其存在两个不足:1)ECE在提取原因前必须对情感进行标注,这极大地限制了其在现实场景中的应用;2)首先对情感进行标注,然后提取原因的方法忽略了它们是相互指示的这一事实。这篇论文提出了一个新的任务:情感-原因对提取(emod -cause pair extraction, ECPE),它的目的是提取文档中潜在的情感和相应的原因。
2. 简介
图1展示了传统的ECE任务和新的ECPE任务之间的区别。以图1为例,给出emotion的标注:“happy”,ECE的目标是追踪两个对应的cause子句:“a policeman visit the old man with the lost money”和“and told him that the thief was caught”。在ECPE任务,目标是直接提取所有的情感原因对(emotion cause pair),包括(“老人非常高兴”,”一个警察拜访老人亏损”)和(“老人非常高兴”,“告诉他,小偷被抓住了”),不提供情感注释“幸福”。
为了解决这个新的ECPE任务,论文提出了一个两步框架。步骤1通过两种多任务学习网络将情感原因对提取任务转换为两个独立的子任务分别是情感提取(emotion extraction)和原因提取(cause extraction)。步骤2执行情感原因配对和筛选。论文将两个集合的所有元素组合成对,最后训练一个过滤器来排除不包含因果关系的情感原因对。
3. 方法
步骤1:个体情感和原因提取
步骤1的目标是分别为每个文档提取一组情感子句和一组原因子句。为此,提出了两种多任务学习网络。独立多任务学习和交互式多任务学习。后者是一个加强版,在前者的基础上进一步抓住了情感和原因之间的相关性。
1.独立多任务学习
一个文档包含多个子句:d = [c1,c2,…],每个ci也包含多个词ci = [wi1,wi2,…]。为了捕获这样的“word-clause-document”结构,使用一个分层的Bi-LSTM网络,它包含两个层,如图2所示。
底层由一组单词级的Bi-LSTM模块组成,每个模块对应一个子句,并为子句的每个单词积累上下文信息。上层包括两个部分:一个用于情感提取,另一个用于原因提取。每个组件都是一个子句级的Bi-LSTM,它接收在输入层输入的子句ci经过字向量编码后的si。两部分Bi-LSTM的隐含状态rei和rci可以看作是从子句ci提取出的情感和原因,并最终反馈到softmax层进行情感预测和原因预测。
2.交互式多任务学习
到目前为止,上层的两个Bi-LSTM分量是相互独立的。然而,这两个子任务(情感提取和原因提取)并不是相互独立的。一方面,提供情感可以帮助更好地发现原因;另一方面,了解原因也可能有助于更准确地提取情感。
结构如图3所示。需要注意的是,使用情感提取来改进原因提取的方法被称为Inter-EC。使用原因提取来增强情感提取的方法被称为Inter-CE。由于Inter-EC和Inter-CE在结构上相似,所以只介绍Inter-EC(如图3 (a)所示)。
与独立的多任务学习相比,Inter-EC的底层是不变的,而上层由两个部分组成,分别用于情感提取任务和以交互方式预测原因提取任务。每个组件都是一个子句级的Bi-LSTM,然后是一个softmax层。
步骤2:情感原因配对和过滤
在步骤1中,最终得到了一组情感和一组原因集合。第二步的目标是将这两个集合配对。
首先,对E(情感子句集)和C(原因子句集)应用一个笛卡尔积,得到所有可能对的集合:Pall ={···,(cei,ccj),···}
其次,用一个由三种特征组成的特征向量来表示Pall中的每一对:
其中,Sei和Sci分别表示cei,ccj经过字向量编码后的结果,Vd表示cei与ccj之间的距离。
然后训练Logistic回归模型,检测每个候选对(cei,ccj), cei与ccj之间是否存在因果关系:
yˆ(cei与ccj) = 1 表明 (cei,ccj)存在因果关系, yˆ(cei与ccj) = 0 表明 (cei,ccj)没有因果关系, and δ(·) 是一个 Sigmoid 函数. 从 Pall中移除yˆ(cei与ccj) = 0的(cei,ccj)对,得到最终的 emotion-cause 对。
4.结论
论文基于基准的情感原因数据集(emotion cause dataset)(Gui等人,2016a)评估了该方法,在测试数据上没有使用情感注释。最终在情感-原因对提取中取得了61.28%的F1分数。实验结果证明了该方法的可行性和有效性。除了情感-原因对提取评价外,论文还评价了两个单独任务(情感提取和原因提取)的性能。与传统的消除情感标注依赖的ECE方法相比,该方法具有很大的优越性。