基于话题要素相似度计算的报道关系识别方法

时间:2016-04-02 04:35:05
【文件属性】:

文件名称:基于话题要素相似度计算的报道关系识别方法

文件大小:343KB

文件格式:PDF

更新时间:2016-04-02 04:35:05

相似度

本文针对现有的向量空间模型在表示同主题话题报道的不足,提出了一种基于话题要素的报道表示模型和相似 度计算方法。对于每一类话题要素,分别提出相应的相似度计 算方法,进而得到报道相似度计算方法。最后通过话题跟踪的 实验对基于话题要素的报道关系识别模型进行检验。实验表 明,基于话题要素的报道表示模型在处理同主题的报道关系识 别上是有效的。由于报道中可能涉及与核心事件不相关的信 息,如英国伦敦爆炸案中出现“美国总统布什”、“早在1982年” 等信息,这样在抽取时间、地点、人物等特征时会引入噪声,从而 影响报道相似度计算的精度。因此接下来的工作主要集中在话 题要素的抽取上,通过精确抽取话题要素进一步提高报道匹配 算法的精度。


网友评论