文件名称:论文研究-泛化语言模型在汉维机器翻译中的应用.pdf
文件大小:577KB
文件格式:PDF
更新时间:2022-08-11 16:18:51
汉维机器翻译,泛化语言模型,字符串相似度算法,归一化处理,规则,译文评分
针对汉维统计机器翻译中*语具有长距离依赖问题和语言模型具有数据稀疏现象,提出了一种基于泛化的*语语言模型。该模型借助*语语言模型的训练过程中生成的文本,结合字符串相似度算法,取相似的维文字符串经过归一化处理抽取规则,计算规则的参数值,利用规则给测试集在解码过程中生成n-best译文重新评分,将评分最高的译文作为最佳译文。实验结果表明,泛化语言模型减少了存储空间,同时,规则的合理使用有效地提高了翻译译文的质量。