文件名称:text-rank:textrank 提取文章摘要与结果优化
文件大小:79KB
文件格式:ZIP
更新时间:2024-06-03 18:34:32
Python
简单介绍 这里的代码主要是采用text-rank算法计算文本摘要,另外优势在于引入了词向量和权重倾斜 使得文章摘要提取效果得到了非常显著的提升。 注意 注意:由于github文件有大小限制,这里没有上传完整的词向量模型,所以无法直接运行,需要补充textrank4zh/word_model目录中的数据。 如果有需要,可在我的百度网盘下载,或者自己训练放入textrank4zh/word_model文件夹。 链接: https://pan.baidu.com/s/1o9RlASq 密码: 4kug 依赖 jieba >= 0.35 numpy >= 1.7.1 networkx >= 1.9.1 gensim 兼容性 适用于Python 2.7,已经测试过 原理 关于原理以及本代码实现的效果优化可见我上传的论文 《text-rank提取文章摘要与结果优化.doc》 阅读完对使用有很大
【文件预览】:
text-rank-master
----my_log.log(8KB)
----textrank4zh()
--------TextRank4Keyword.pyc(6KB)
--------util.py(8KB)
--------compute_yingda.pyc(6KB)
--------util.pyc(9KB)
--------Segmentation.pyc(6KB)
--------__init__.pyc(455B)
--------TextRank4Keyword.py(6KB)
--------word_model()
--------stopwords.txt(7KB)
--------non_words.txt(190B)
--------__init__.py(221B)
--------compute_yingda.py(6KB)
--------TextRank4Sentence.py(4KB)
--------TextRank4Sentence.pyc(4KB)
--------Segmentation.py(6KB)
----ceshi.py(2KB)
----LICENSE(1KB)
----context()
--------0010(6KB)
--------0008(8KB)
--------0012(3KB)
--------0001(1KB)
--------0004(5KB)
--------0007(19KB)
--------0013(4KB)
--------0009(3KB)
--------0016(171B)
--------0006(6KB)
--------0002(753B)
--------0011(4KB)
--------0005(3KB)
--------0003(10KB)
--------0014(5KB)
--------0015(3KB)
----setup.py(1KB)
----README.md(3KB)