text-summarization:提取与抽象文本摘要方法

时间:2024-05-31 07:47:51
【文件属性】:

文件名称:text-summarization:提取与抽象文本摘要方法

文件大小:1.85MB

文件格式:ZIP

更新时间:2024-05-31 07:47:51

JupyterNotebook

提取与抽象文本摘要方法:分析 文本摘要解决了将信息压缩为更紧凑形式的问题,同时又将重要信息保留在文本中。 自动文本摘要的方法分为两个主要类别:提取性和抽象性。 提取摘要的常见方法包括根据句子的相关性,选择最能代表原始文本表达信息的最具代表性的句子。 一种流行的抽象文本摘要方法是使用编码器-解码器结构,该结构会生成数据的潜在因子表示形式,并将其解码以生成摘要。 该项目的目的是分析和比较两种方法在专门用于科学文献时的有效性。 动机 我从事此项目的动力来自个人经验。 作为一名大学学生,我经常会遇到大量与我的兴趣相关的科学论文和研究文章,但我没有时间阅读所有内容。 我希望有一种方法能够对论文的主要思想进行汇总,而又不会显着减少重要内容。 文本摘要是一种广泛实施的算法,但是我想探索特别适用于科学写作的不同文本摘要方法。 介绍 自动文本摘要是使用信息优先级排序系统缩短文本文档的过程。 生成摘要的技术会


【文件预览】:
text-summarization-master
----testing.ipynb(11KB)
----EmbeddingAttempt4.ipynb(13KB)
----embeddingNotebook.ipynb(48KB)
----p5.png(24KB)
----p6.png(13KB)
----tokenize_recipes.py(2KB)
----MICHELLEZHAO_CS141_finalreport.pdf(401KB)
----Reduction.ipynb(15KB)
----TrainAttempt4.ipynb(76KB)
----cs141_final_poster_toSize.pptx(313KB)
----Extractive vs. Abstractive Text Summarization.pdf(272KB)
----p1.png(52KB)
----trainNotebook.ipynb(80KB)
----p2.png(48KB)
----algo1.png(151KB)
----_config.yml(32B)
----p4.png(140KB)
----simpler.ipynb(11KB)
----train2.ipynb(17KB)
----README.md(19KB)
----simpleTrain.ipynb(1.7MB)
----p3.png(466KB)
----train3.ipynb(72B)
----embedding2.ipynb(15KB)
----train.ipynb(83KB)
----train_seq2seq.py(5KB)
----stopWords.txt(4KB)
----predict.py(4KB)
----p7.png(10KB)

网友评论