文件名称:Clinical-Entity-Recognition:i2b2数据集上CER的Tensorflow实现
文件大小:12.45MB
文件格式:ZIP
更新时间:2024-05-29 02:50:53
Python
使用Tensorflow进行临床实体识别 此仓库使用Tensorflow实现了CER模型(字符嵌入+单词嵌入+ BLSTM + CRF)。 合奏训练后的最新表现(测试集上的F1分数在84到85之间)。 有关更多详细信息,请检查。 使用预先训练的模型 使用TensorFlow可以轻松加载预训练图。 预训练的模型在exp dir中。 将集成训练模型与 # pretrained ensemble of models models= " exp/adam.cap-2.char-100-100.word-300-300.lstm-1.p-0 exp/rmsprop.char-100-100.plstm-2 exp/rmsprop.cap-5.char-100-100.word-300-300.sru-1 exp/rmsprop.cap-5.char-100-300.word-300-300.l
【文件预览】:
Clinical-Entity-Recognition-master
----build_data.py(2KB)
----ensemble.sh(2KB)
----train.py(891B)
----grid.sh(1KB)
----model()
--------config.py(5KB)
--------data_utils.py(12KB)
--------ner_model.py(18KB)
--------__init__.py(0B)
--------general_utils.py(5KB)
--------base_model.py(5KB)
--------SRUCell.py(4KB)
--------debug.py(1KB)
--------ensemble.py(11KB)
----combine.py(768B)
----doc()
--------ensemble_crf.pdf(44KB)
--------report.pdf(96KB)
--------blstm-crf.pdf(19KB)
--------report.tex(7KB)
----res(157B)
----predict.sh(108B)
----README.md(3KB)
----data()
--------glove.6B.300d.trimmed.npz(11.33MB)
--------test.txt(1.46MB)
--------train.txt(1.06MB)
--------chars.txt(173B)
--------dev.txt(471KB)
--------words.txt(61KB)
--------tags.txt(59B)
----evaluate.py(2KB)
----conlleval(13KB)