文件名称:Skip-N蒙古文统计语言模型* (2008年)
文件大小:269KB
文件格式:PDF
更新时间:2024-06-07 19:43:46
自然科学 论文
蒙古文具有典型的构词词缀的特点,一个词往往可以切分成词干和词缀等若干个部分。如果采用通常的N-gram语言模型很难描述词干、词缀等的长距离依赖关系。提出了一种利用长距离依赖的Skip-N语言模型,给出了相隔N个词的二元依赖关系。对这种方法进行了实现,并在一个基于实例的汉蒙机器翻译系统上进行了实验,实验证明Skip-N语言模型能够有效地提高汉蒙机器翻译的效果。