文件名称:基于条件随机域CRF模型的文本信息抽取
文件大小:183KB
文件格式:PDF
更新时间:2015-01-15 09:22:55
条件随机域 CRF模型
为了抽取文本中的信息,在分析对比了4种统计建模原型后,选用条件随机域CRY建立抽取模型,提出了一种文本信息抽取的方法。该方法对文本分析后加标注,确定文本特征集,采用有限内存拟牛顿迭代方法L—BFGS算法估计CRF模型参数,根据训练学习得出的模型,实现科研论文数据集头部文本信息的抽取。实验结果表明,使用CRF模型的抽取准确率达到90%以上,远远高于使用HMM模型的抽取准确率。