文件名称:Auto Summarization tool using java:自动摘要可为文档提供简洁的摘要。-开源
文件大小:95KB
文件格式:PPTX
更新时间:2024-06-16 15:32:26
开源软件
自动摘要可为文档提供简洁的摘要。 在本文中,我提出了一种统计方法来解决独立于域的单文档摘要中的文本生成问题。 我的论文包括Salton的向量空间模型,该模型将句子分为几类,也可用于总结WebPages中的内容。 汇总器最初根据分隔符将整个文档分解为句子。 第二步是从文档中删除不必要的单词。 删除停用词后的文档将再次针对唯一词进行修订。 唯一词是具有相同含义或在文档中可能多余的词。 通过称为“阻止”的方法将其删除。 通过使用词干提取机制,可以计算单词的出现次数,并以出现次数和出现次数的格式显示结果。