文件名称:Markov模型计算词性标记序列的概率-隐马尔科夫模型及其在自然语言处理中的应用
文件大小:766KB
文件格式:PPT
更新时间:2024-05-14 07:21:15
隐马尔科夫 自然语言
Markov模型计算词性标记序列的概率 S = 美国/N 总统/n 奥巴马/N 非常/ad 愿意/vi 来/vt 中国/N 访问/vt (假设一个语料集存在6种词性,S是其中的一个句子) 状态转移矩阵为: P(12164313) = P(3|1)P(1|3)P(3|4)P(4|6)P(6|1)P(1|2)P(2|1)P(1) = 0.3×0.2×0.2×0.25×0.1×0.05×0.1×1 = 1.5×10-6 状态1:N 专有名词 状态2:n 普通名词 状态3:vt 及物动词 状态4:vi 不及物动词 状态5:adj 形容词 状态6:adv 副词