【文件属性】:
文件名称:BertSum:纸的代码微调BERT,用于提取摘要
文件大小:14.99MB
文件格式:ZIP
更新时间:2021-05-03 02:21:18
Python
BertSum
该代码是针对纸质Fine-tune BERT for Extractive Summarization ( )
!新:请查看我们的其中包含受过训练的模型
CNN / Dailymail的结果(25/3/2019):
楷模
ROUGE-1
ROUGE-2
ROUGE-L
变压器基线
40.9
18.02
37.17
BERTSUM +分类器
43.23
20.22
39.60
BERTSUM +变压器
43.25
20.24
39.63
BERTSUM + LSTM
43.22
20.17
39.59
Python版本:此代码在Python3.6中
软件包要求:pytorch pytorch_pretrained_bert tensorboardX多进程pyrouge
一些代码是从ONMT借来的( )
CNN / Dailymail
【文件预览】:
BertSum-master
----models()
--------.gitignore(13B)
----logs()
--------.gitignore(13B)
----raw_data()
--------.gitignore(13B)
----LICENSE(11KB)
----json_data()
--------cnndm_sample.train.0.json(83KB)
----src()
--------models()
--------others()
--------train.py(13KB)
--------preprocess.py(2KB)
--------prepro()
--------distributed.py(4KB)
----results()
--------.gitignore(13B)
----README.md(5KB)
----bert_data()
--------.gitignore(13B)
----urls()
--------mapping_train.txt(44.27MB)
--------cnn_mapping_train.txt(9.95MB)
--------mapping_valid.txt(2.32MB)
--------cnn_mapping_valid.txt(139KB)
--------cnn_mapping_test.txt(130KB)
--------mapping_test.txt(2.01MB)
----bert_config_uncased_base.json(313B)