文件名称:Podcast_Text_Summarization_NLP_Project
文件大小:3.07MB
文件格式:ZIP
更新时间:2024-03-03 21:12:52
JupyterNotebook
Podcast_Text_Summarization_NLP_Project 总览 我每周花费无数小时来吸收播客,而且我也热衷于探索新的NLP技术。 在这个项目中,我将比较两个文本摘要化模型,同时总结一些2021年*播客描述。 希望我能发现一个新的播客,一路收听! 数据 该项目中使用的播客描述和照片摘自可在以下位置找到的保洁文章: 使用Pegasus进行文本摘要 我想探索的第一种文本摘要方法是PEGASUS。 PEGASUS是Google开源的最新的抽象摘要模型。 我正在使用已经在XSUM数据集上进行过预训练的Pegasus模型,并使用此拥抱页面作为我的Pegasus模型的基础。 在此处阅读有关飞马的更多信息: 使用Transformers Library和Google T5模型进行文本汇总 在此模型中,我将使用Google的T5编码器-解码器模型使用转换器库对文本进行求和。 这种夏日
【文件预览】:
Podcast_Text_Summarization_NLP_Project-main
----podcast_text_summarization.ipynb(65KB)
----Podcast Text Summarization.pdf(3.14MB)
----README.md(2KB)
----data()
--------podcast_pegasus.csv(23KB)
--------podcast_with_summary.csv(27KB)
----Pegasus_project_text_summary.ipynb(196KB)