文件名称:论文研究-基于联合训练的蛋白质互作用信息抽取方法.pdf
文件大小:215KB
文件格式:PDF
更新时间:2022-08-11 12:43:45
蛋白质互作用,半监督,联合训练,词特征,模式学习
针对生物文献库中人工标注样本数量缺乏的问题,提出一种半监督类型的基于联合训练的方法。在样本预处理的基础上,基于词特征的机器学习方法和基于模式学习的方法选择样本的不同特征子集,并被合成到联合训练方法中;在训练过程中每种方法能够利用少量初始标注样本和大量未标注样本进行学习,并用另一方法的学习结果扩充标注样本集。该方法在AIMED语料库中获得了63.9%的F1值,比较实验结果表明,该方法性能优于监督方法,且能有效利用未标注样本以适应实际抽取任务。