汉语信息熵和语言模型的复杂度.pdf

时间:2019-09-16 11:37:31
【文件属性】:

文件名称:汉语信息熵和语言模型的复杂度.pdf

文件大小:2.14MB

文件格式:PDF

更新时间:2019-09-16 11:37:31

熵 复杂度 统计语言模型

本文介绍了估计汉语信息摘的方法,井通过对大量语料的统计,给出了汉语信息熵的一个上界-5.17比特/汉字。本文还以此为基础对统计语言模型的能力进行了定量的描述,比较了常用的统计语言模型的性能,并给出了一种用低阶语言模型逼近高阶模型的方法。


网友评论