文件名称:BERT实现文本分类.rar
文件大小:365.95MB
文件格式:RAR
更新时间:2021-10-17 10:54:49
BERT 自然语言处理 文本分类
将训练集、测试集、验证集、标签集放到THUCNews/data文件夹下即可。数据格式为每行一个句子加它的标签,用\t分隔开。文件中已经包含了BERT的预训练模型。项目的详解博客在https://blog.csdn.net/Q_M_X_D_D_/article/details/120583820
【文件预览】:
tc
----bert_pretrain()
--------config.json(647B)
--------vocab.txt(107KB)
--------pytorch_model.bin(392.51MB)
----models()
--------bert_RNN.py(3KB)
--------ERNIE.py(2KB)
--------bert.py(3KB)
--------__pycache__()
--------bert_DPCNN.py(4KB)
--------bert_CNN.py(3KB)
--------bert_RCNN.py(3KB)
----test.py(465B)
----pytorch_pretrained()
--------file_utils.py(9KB)
--------tokenization_transfo_xl.py(22KB)
--------tokenization_openai.py(14KB)
--------convert_openai_checkpoint_to_pytorch.py(3KB)
--------modeling_openai.py(37KB)
--------tokenization.py(17KB)
--------convert_transfo_xl_checkpoint_to_pytorch.py(6KB)
--------modeling.py(59KB)
--------convert_tf_checkpoint_to_pytorch.py(3KB)
--------__init__.py(1KB)
--------optimization_openai.py(5KB)
--------tokenization_gpt2.py(13KB)
--------optimization.py(13KB)
--------convert_gpt2_checkpoint_to_pytorch.py(3KB)
--------modeling_gpt2.py(31KB)
--------__main__.py(4KB)
--------modeling_transfo_xl.py(58KB)
--------modeling_transfo_xl_utilities.py(16KB)
--------__pycache__()
----utils.py(4KB)
----run.py(2KB)
----.idea()
--------inspectionProfiles()
--------modules.xml(263B)
--------tc.iml(334B)
----LICENSE(1KB)
----README.md(3KB)
----train_eval.py(6KB)
----__pycache__()
--------utils.cpython-37.pyc(3KB)
--------train_eval.cpython-37.pyc(4KB)
----THUCNews()
--------saved_dict()
--------data()