文件名称:BertSum:纸的代码微调BERT,用于提取摘要
文件大小:14.99MB
文件格式:ZIP
更新时间:2024-05-22 20:07:58
Python
BertSum 该代码是针对纸质Fine-tune BERT for Extractive Summarization ( ) !新:请查看我们的其中包含受过训练的模型 CNN / Dailymail的结果(25/3/2019): 楷模 ROUGE-1 ROUGE-2 ROUGE-L 变压器基线 40.9 18.02 37.17 BERTSUM +分类器 43.23 20.22 39.60 BERTSUM +变压器 43.25 20.24 39.63 BERTSUM + LSTM 43.22 20.17 39.59 Python版本:此代码在Python3.6中 软件包要求:pytorch pytorch_pretrained_bert tensorboardX多进程pyrouge 一些代码是从ONMT借来的( ) CNN / Dailymail
【文件预览】:
BertSum-master
----models()
--------.gitignore(13B)
----logs()
--------.gitignore(13B)
----raw_data()
--------.gitignore(13B)
----LICENSE(11KB)
----json_data()
--------cnndm_sample.train.0.json(83KB)
----src()
--------models()
--------others()
--------train.py(13KB)
--------preprocess.py(2KB)
--------prepro()
--------distributed.py(4KB)
----results()
--------.gitignore(13B)
----README.md(5KB)
----bert_data()
--------.gitignore(13B)
----urls()
--------mapping_train.txt(44.27MB)
--------cnn_mapping_train.txt(9.95MB)
--------mapping_valid.txt(2.32MB)
--------cnn_mapping_valid.txt(139KB)
--------cnn_mapping_test.txt(130KB)
--------mapping_test.txt(2.01MB)
----bert_config_uncased_base.json(313B)