文件名称:未定义类型的关系抽取的半监督学习框架研究 (2012年)
文件大小:1.03MB
文件格式:PDF
更新时间:2024-07-05 19:52:32
自然科学 论文
设计未定义类型关系抽取系统是目前研究的热点.但在没有特定领域的、机器可读的知识作为指导的情况下,面向自然语言文本的关系抽取很难取得令人满意的精确度和召回率,约束可以有效辅助语义关系的抽取.本文描述了一个提劝实体-属性-值”关系的半监督的机器学习框架,在半监督学习任务中,种子主要从*的信息表格中获取,首先用线性分类器找出一些强反例,然后迭代的使用已有的反例数据重新训练分类器再应用到余下的未标注数据上找出更多反例.经过半监督学习得到了一个关系候选实例集,接下来讨论了关系类别验证问题,对于噪声模式,给出关