融合特征约束模型的纳西一汉语双语词语对齐算法 (2011年)

时间:2024-06-09 23:47:14
【文件属性】:

文件名称:融合特征约束模型的纳西一汉语双语词语对齐算法 (2011年)

文件大小:412KB

文件格式:PDF

更新时间:2024-06-09 23:47:14

工程技术 论文

针对纳西语、汉语因句法结构差异较大而导致双语词语自动对齐较为困难的问题,提出一种融合特征约束模型的纳西一汉语双语词语对齐算法.首先在语料中统计纳西一汉语词语区间扭曲和位置转换特性,并由此建立2个双语词语对齐的特征约束模型;然后将提出的特征约束模型融入词语对齐的对数线性模型框架,并结合最小错误率算法训练模型参数;最终搜索出最佳的词语对齐结果.实验以IBMModel3为词语对齐比较模型,结果表明,该双语词语对齐算法可以使纳西一汉语词语的对齐准确率提升21.9%.


网友评论