文件名称:统计与规则相结合的术语抽取 (2011年)
文件大小:175KB
文件格式:PDF
更新时间:2024-07-04 03:09:32
工程技术 论文
在面向特定领域的分词中,术语抽取效果的好坏会对分词精度产生很大影响。因此,高精度的术语抽取成为领域分词的基础工作。针对特定领域提出了一种统计和规则相结合的术语抽取方法。在条件随机场给出的5-best结果的基础上,通过规则及给分机制进行术语抽取,并对抽取结果利用规则进行后处理。实验表明,相比于传统的基于条件随机场1-best进行的术语抽取,该方法能够明显提高未登录术语的召回率。