文件名称:基于EM算法的汉语自动分词
文件大小:332KB
文件格式:PDF
更新时间:2015-04-17 16:19:25
EM算法,自动分词
汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用,以及汉语分词 的基本方法进行了概述。接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可 夫模型,并重点剖析了EM(Expectation2Maximization) 算法,对实验结果进行了分析。最后对算法进行了总结与讨论。
文件名称:基于EM算法的汉语自动分词
文件大小:332KB
文件格式:PDF
更新时间:2015-04-17 16:19:25
EM算法,自动分词
汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用,以及汉语分词 的基本方法进行了概述。接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可 夫模型,并重点剖析了EM(Expectation2Maximization) 算法,对实验结果进行了分析。最后对算法进行了总结与讨论。