基于CTD-BLSTM的医疗领域中文命名实体识别模型

时间:2024-05-26 05:55:49
【文件属性】:

文件名称:基于CTD-BLSTM的医疗领域中文命名实体识别模型

文件大小:1.06MB

文件格式:PDF

更新时间:2024-05-26 05:55:49

双向长短期记忆网络 协同训练 中文命名实体识别 问答系统 医疗领域

为在模型训练期间保留更多信息, 用预训练词向量和微调词向量对双向长短期记忆网络(Bi-LSTM)神经模型进行扩展, 并结合协同训练方法来应对医疗文本标注数据缺乏的情况, 构建出改进模型CTD-BLSTM (Co-Training Double word embedding conditioned Bi-LSTM)用于医疗领域的中文命名实体识别. 实验表明, 与原始BLSTM与BLSTM-CRF相比, CTD-BLSTM模型在语料缺失的情况下具有更高的准确率和召回率, 能够更好地支持医疗领域知识图谱的构建以及知识问答系统的开发.


网友评论