文件名称:emr-ner:NER用于中国电子病历。 使用doc2vec,self_attention和multi_attention
文件大小:39KB
文件格式:ZIP
更新时间:2024-05-18 05:18:29
Python
NER for Chinese electronic medical records. Use doc2vec, self_attention and multi_attention. 系统:ubuntu 16.04 server 语言:python3 版本:Anaconda3-5.1.0 框架:Tensorflow-gpu 1.7.0 doc2vec:pip install doc2vec ccks2018 面向中文电子病历的命名实体识别 基于字级BLSTM和CRF的NER模型,一篇病历作为一个批次,批次内按句号进行切分。 1.使用Glove工具对预先准备好的无标注数据进行训练,获取预训练的词嵌入。 2.使用无标注数据构建基于两层LSTM和Softmax的神经语言模型;考虑到单词上文和下文的信息都有效,训练正向和反向两个LM,独立训练参数无关,区别是反向对输入进行翻转。
【文件预览】:
emr-ner-master
----doc2vec()
--------doc2vec.py(647B)
----ner_split()
--------attention.py(3KB)
--------ner_utils.py(3KB)
--------conlleval(12KB)
--------ner_main.py(5KB)
--------ner_model.py(11KB)
----ner_all()
--------attention.py(3KB)
--------ner_utils.py(3KB)
--------conlleval(12KB)
--------ner_main.py(5KB)
--------ner_model.py(11KB)
----change_result.py(3KB)
----.gitignore(1KB)
----lm()
--------pre_data.py(4KB)
--------lm_model.py(7KB)
--------lm_main.py(7KB)
--------lm_utils.py(2KB)
----README.md(2KB)
----ner()
--------attention.py(626B)
--------ner_utils.py(4KB)
--------conlleval(12KB)
--------ner_main.py(5KB)
--------ner_model.py(12KB)