文件名称:synthetic_hpi_ner:该存储库包含该论文的补充数据和代码
文件大小:22.51MB
文件格式:ZIP
更新时间:2024-04-21 22:17:21
Python
Composite_hpi_ner 该存储库包含人工注释的合成语料库和论文代码:合成临床笔记对真正的自然语言处理任务有用:临床实体识别的案例研究。 要求 安装python,tensorflow。 我们使用Python 3.6,Tensorflow 1.15.2。 如果计划使用GPU计算,请安装CUDA。 使用I2B2 2010和N2C2 2018 HPI(synth_hpi)在synth_hpi下的每个模型文件夹中使用脚本训练所有合成语言模型(run_train _#。sh / run_gen _#。sh,#分别代表charrnn,ctrl,gpt2和seggan)疾病)部分数据。 原始的I2B2 2010和N2C2 2018挑战数据可在获得,这需要额外的登录或注册。 使用scripts文件夹中的脚本训练所有NER模型。 手动注释的合成数据可在数据/注释/合成中获得。 在训练10倍