文件名称:BERT-CH-NER:基于BERT的中文命名实体识别
文件大小:1.7MB
文件格式:ZIP
更新时间:2024-02-24 12:10:55
nlp deeplearning ner bert NaturallanguageprocessingPython
基于BERT的中文数据集下的命名实体识别(NER) 基于tensorflow官方代码修改。 环境 Tensorflow:1.13 的Python:3.6 tensorflow2.0会报错。 搜狐比赛 在搜狐这个文本比赛中写了一个基准,使用了bert以及bert + lstm + crf来进行实体识别。 其后只使用BERT的结果如下,具体评估方案请看比赛说明,这里的话只做了实体部分,情感全部为POS进行的测试嘲笑。 使用bert + lstm + crf结果如下 训练验证测试 export BERT_BASE_DIR=/opt/hanyaopeng/souhu/data/chinese_L-
【文件预览】:
BERT-CH-NER-master
----images()
--------1553305073652.png(42KB)
--------1553305543516.png(11KB)
--------1553304765330.png(7KB)
--------1553304598242.png(5KB)
--------1557228899471.png(12KB)
--------1557228995787.png(13KB)
--------1553306691480.png(116KB)
--------1553264280882.png(37KB)
--------1553305053823.png(15KB)
----.DS_Store(6KB)
----bert-master()
--------.gitignore(1KB)
--------predicting_movie_reviews_with_bert_on_tf_hub.ipynb(65KB)
--------optimization_test.py(2KB)
--------tokenization.py(12KB)
--------requirements.txt(110B)
--------tokenization_test.py(4KB)
--------modeling_test.py(9KB)
--------__init__.py(616B)
--------CONTRIBUTING.md(1KB)
--------run_squad.py(45KB)
--------run_classifier.py(37KB)
--------LICENSE(11KB)
--------optimization.py(7KB)
--------run_classifier_with_tfhub.py(9KB)
--------tf_metrics.py(8KB)
--------modeling.py(37KB)
--------README.md(42KB)
--------run.sh(650B)
--------.idea()
--------run_NER.py(43KB)
--------sample_text.txt(4KB)
--------multilingual.md(11KB)
--------run_pretraining.py(20KB)
--------extract_features.py(14KB)
--------create_pretraining_data.py(15KB)
----README.md(9KB)
----.idea()
--------BERT-NER.iml(602B)
--------misc.xml(309B)
--------workspace.xml(7KB)
--------vcs.xml(180B)
--------modules.xml(268B)
----tmp()
--------dev-lable.txt(79KB)
--------dev.txt(133KB)
--------target.txt(1.97MB)
--------source.txt(3.14MB)
--------test_tgt.txt(41KB)
--------test1.txt(63KB)
----souhu()
--------run_souhu.py(39KB)
--------lstm_crf_layer.py(7KB)
--------run_souhuv2.py(40KB)
--------souhu_util.py(4KB)