NER_bLSTM-CRF:具有ConLL-2002数据集的NER的LSTM-CRF

时间:2024-06-02 19:04:16
【文件属性】:

文件名称:NER_bLSTM-CRF:具有ConLL-2002数据集的NER的LSTM-CRF

文件大小:3.43MB

文件格式:ZIP

更新时间:2024-06-02 19:04:16

crf keras lstm named-entity-recognition ner

CRF,bi-LSTM-CRF用于命名实体识别 这是使用各种CRF解决方案进行命名实体识别的概念证明。 此处的演示使用全小写的文本,以便在不提供案例信息的文本上模拟NER(例如自动语音识别输出) 2018年6月8日更新: 现在,训练/测试拆分在各个模型中是一致的 对两个模型都使用pycrfsuite报告 为pycrfsuite代码添加了MIT许可证 删除了不需要的/未分发的代码,调整了要求 扩展评论 增加结果 要求 gensim keras keras-contrib tensorflow numpy pandas python-crfsuite 运行功能设计的CRFsuite CRF: 运行data-preprocessing.ipynb以生成格式化的模型数据 运行pycrfsuite-training.ipynb以适合模型 有关示例输出,请参见results/pyCRF-samp


【文件预览】:
NER_bLSTM-CRF-master
----preprocessing.py(2KB)
----.gitignore(311B)
----embedding.py(1KB)
----results()
--------pyCRF_sample.csv(292KB)
--------keras-biLSTM-CRF_sample.csv(206KB)
----encoded()
--------_placeholder(0B)
----data()
--------gazetteer_countries.txt(1KB)
--------gazetteer_names.txt(1KB)
--------gazetteer_demonyms.txt(3KB)
--------ner_dataset_utf8.csv(13.5MB)
--------gazetteer_cities.txt(246B)
--------gazetteer_datetime.txt(132B)
----model()
--------conll2002-test.crfsuite(623KB)
----data_preprocessing.ipynb(11KB)
----pycrfsuite-training.ipynb(31KB)
----embeddings()
--------_placeholder(0B)
----keras_training.ipynb(21KB)
----README.md(4KB)
----keras-decoding.ipynb(32KB)

网友评论