文件名称:利用统计搭配模型改进基于实例的机器翻译
文件大小:724KB
文件格式:PDF
更新时间:2017-03-20 10:15:20
统计搭配模型
基于实例的机器翻译(example-based machine translation,简称EBMT)使用预处理过的双语例句作为主要翻译资源,通过编辑与待翻译句子匹配的翻译实例来生成译文.在EBMT系统中,翻译实例选择及译文选择对系统性能影响较大.提出利用统计搭配模型来增强EBMT 系统中翻译实例选择及译文选择的能力,提高译文质量.首先,使用单语统计词对齐从单语语料中训练统计搭配模型.然后,利用该模型从3 个方面提高EBMT 的性能:(1) 利用统计搭配模型估计待翻译句子与翻译实例之间的匹配度,从而增强系统的翻译实例选择能力;(2) 通过引入候选译文与上下文之间搭配强度的估计来提高译文选择能力;(3) 使用统计搭配模型检测翻译实例中被替换词的搭配词,同时根据新的替换词及上下文对搭配词进行矫正,进一步提高EBMT系统的译文质量.为了验证所提出的方法,在基于词的EBMT 系统上评价了英汉翻译的译文质量.与基线系统相比,所提出的方法使译文的BLEU 得分提高了4.73~6.48个百分点.在半结构化的EBMT系统上进一步检验了基于统计搭配模型的译文选择方法,从实验结果来看,该方法使译文的BLEU 得分提高了1.82 个百分点.同时,人工评价结果显示,改进后的半结构化EBMT 系统的译文能够表达原文的大部分信息,并且具有较高的流利度.