文件名称:基于话题要素相似度计算的报道关系识别方法
文件大小:343KB
文件格式:PDF
更新时间:2016-04-02 04:35:05
相似度
本文针对现有的向量空间模型在表示同主题话题报道的不足,提出了一种基于话题要素的报道表示模型和相似 度计算方法。对于每一类话题要素,分别提出相应的相似度计 算方法,进而得到报道相似度计算方法。最后通过话题跟踪的 实验对基于话题要素的报道关系识别模型进行检验。实验表 明,基于话题要素的报道表示模型在处理同主题的报道关系识 别上是有效的。由于报道中可能涉及与核心事件不相关的信 息,如英国伦敦爆炸案中出现“美国总统布什”、“早在1982年” 等信息,这样在抽取时间、地点、人物等特征时会引入噪声,从而 影响报道相似度计算的精度。因此接下来的工作主要集中在话 题要素的抽取上,通过精确抽取话题要素进一步提高报道匹配 算法的精度。