文件名称:汉语信息熵和语言模型的复杂度.pdf
文件大小:2.14MB
文件格式:PDF
更新时间:2019-09-16 11:37:31
熵 复杂度 统计语言模型
本文介绍了估计汉语信息摘的方法,井通过对大量语料的统计,给出了汉语信息熵的一个上界-5.17比特/汉字。本文还以此为基础对统计语言模型的能力进行了定量的描述,比较了常用的统计语言模型的性能,并给出了一种用低阶语言模型逼近高阶模型的方法。
文件名称:汉语信息熵和语言模型的复杂度.pdf
文件大小:2.14MB
文件格式:PDF
更新时间:2019-09-16 11:37:31
熵 复杂度 统计语言模型
本文介绍了估计汉语信息摘的方法,井通过对大量语料的统计,给出了汉语信息熵的一个上界-5.17比特/汉字。本文还以此为基础对统计语言模型的能力进行了定量的描述,比较了常用的统计语言模型的性能,并给出了一种用低阶语言模型逼近高阶模型的方法。