文件名称:attention_RNN_for_textsum:这是转载文章
文件大小:13.7MB
文件格式:ZIP
更新时间:2024-06-04 08:54:47
Python
注意_RNN_for_textsum 这是要复制文章<用于摘要汇总的深化模型> 数据集:CNN_DailyMail 1.1一般信息: 该数据集总共有近290条文章和126万个故事-问题对:90,000个CNN新闻和380,000个故事-问题对200,000个新故事和880,000个故事-问题对通常,新闻文章与几篇文章相关(例如3–5 )要点,这是个故事问题,每个要点都突出了其内容的一个方面。 最初的问题格式为完形填空样式。 这些问题实际上是新闻的亮点,因此可以保证问题的信息包含在给定的故事中。 为了在文本汇总任务中使用数据集,问题被转换为文本汇总。 该数据集的词汇是CNN 120K和DM 210K。 这是非常大的词汇。 段落平均大约30个句子和800个令牌,而每个问题包含大约12–14个令牌。 这不是很困难。 专业是复述任务。 1.2数据集处理: 输入数据集文件格式是顺序的二进制
【文件预览】:
attention_RNN_for_textsum-master
----README.md(4KB)
----model()
--------decoder()
--------bilinear()
--------batcher.py(18KB)
--------decode.py(11KB)
--------util.py(2KB)
--------beam_search.py(8KB)
--------run_summarization.py(16KB)
--------model.py(24KB)
--------attention_decoder.py(18KB)
--------inspect_checkpoint.py(1KB)
--------data.py(11KB)
--------readme(29B)
--------my()
----images()
--------nn_textsum_guider_4.png(26KB)
--------nn_textsum_guider_3.png(21KB)
--------nn_textsum_guider_2.png(117KB)
--------nn_textsum_guider_5.png(78KB)
--------nn_textsum_guider_6.png(13.41MB)
--------readme(16B)
--------nn_textsum_guider_1.png(71KB)