文件名称:使用基于内容的方法进行文本摘要的无监督方法-研究论文
文件大小:741KB
文件格式:PDF
更新时间:2024-06-29 16:31:33
论文研究
在这个时代,互联网在文档可用性方面出现了惊人的增长。 它引起了自动文本摘要领域的详尽研究。 从一个或多个文本内容中提取的不超过原文一半的文本称为概括文本。 这段文字传达了重要信息。 摘要过程产生简洁的摘要,同时保留关键信息内容。 由于人类手动提取大型文本文档的摘要既困难又具有挑战性,现在这些挑战为研究人员提供了机会。 研究人员在这方面做了很多工作。 从可用的文档数量中提取相关信息存在问题。 为了使这项任务自动化,研究人员面临着很多挑战,因为当人类总结一段文本时,他们首先阅读内容以发展他们的理解,然后他们写出突出主要关键点的总结。 由于计算机缺乏人类知识和语言能力,因此这使得这项任务变得困难。 本文重点介绍使用余弦相似度度量以无监督方式总结文本的技术。 在采用这种技术时,用户可以从原始文本中以概括的方式接收代表重要信息的文本。