文件名称:基于维基语义的多文档文摘研究 (2011年)
文件大小:446KB
文件格式:PDF
更新时间:2024-07-05 19:49:42
自然科学 论文
多文档文摘作为自然语言处理领域的重要技术之一,能从不同角度辅助用户实现高效的信息获取。由于文档集合内的内容往往来自不同的信息源,文本之间通常存在丰富而复杂的语义关系。常用的基于词的文档表示法,难以为文摘的语义分析过程提供充足而准确的数据信息为此,我们提出使用*―当今世界最大的在线概念语料库―为多文档文摘的提取提供语义支持。一方面,我们通过提取文档中的维基概念,生成准确一致的句子表示形式。另一方面,在计算句子特征时,我们利用维基词条的首段指导机器文摘的提取。我们首先通过计算概念在维基中的全局相关性和当