基于单个词语特征模板的汉语词性标注 (2011年)

时间:2024-07-05 12:46:32
【文件属性】:

文件名称:基于单个词语特征模板的汉语词性标注 (2011年)

文件大小:821KB

文件格式:PDF

更新时间:2024-07-05 12:46:32

自然科学 论文

针对实际应用中语言模型应该占用更小存储空间且加载速度快等需求,采用最大熵模型进一步研究了汉语词性标注中设定的特征模板集和训练后模型大孝标注精度等指标之间的关系,并在国际汉语分词评测Bake-off2007的PKU、NCC、CTB三种语料上进行了对比实验。实验结果表明,双词语组合特征模板大大增加了训练后模型的大小,对汉语词性标注精度却没有提高,而基于单个词语特征模板训练后的模型大小不足原先大小的1/5,标注精度却没有下降。


网友评论