文件名称:论文研究-基于sentence2vec与半监督算法的中文问答提问模式抽取.pdf
文件大小:840KB
文件格式:PDF
更新时间:2022-08-11 14:34:26
关系抽取, 提问模式, 条件随机场, 自举, 句向量
关系抽取是信息抽取中的一项重要任务。在处理问答对形式的文本时,除了文本中实体间的关系抽取之外,作为连接问句与答句之间关系的提问模式同样需要抽取。通过有监督的标注算法(条件随机场)与基于模板元组自举的半监督算法的结合在抽取实体间关系时有不错的表现,但传统半监督中发现句式模板的方式难以迁移到提问模式抽取中。针对这种情况,通过引入句向量计算文本相似度并选取句式模板,提出一种基于sentence2vec技术与半监督算法结合的模型。对于最终实验,采用随机抽样进行验证。实验结果表明,相较于传统的半监督算法,该方法得到了更高的准确率和召回率。