语义自动标注的方法-文本挖掘PPT

时间:2024-05-15 19:45:08
【文件属性】:

文件名称:语义自动标注的方法-文本挖掘PPT

文件大小:406KB

文件格式:PPT

更新时间:2024-05-15 19:45:08

文本挖掘

语义自动标注的方法 以字义定词义 词=字+…+字 利用检索上下文中出现的相关词的方法来确定多义词的义项 词之间的亲和程度(pen) 利用上下文搭配关系来确定多义词的词义 词性搭配(plan) 用最大可能义项来消解多义 选择多义词各个义项中使用频度最高的义项为它在文本中的当前义项。这显然不是一种科学的办法,但仍然有一定的正确率。 据统计,用最大可能义项来消解多义,对于封闭文本,正确率仅为67.5%,对于开放文本,正确率更低,仅为64.8%。 目前不少机器翻译系统,都采用这种最大可能义项来确定多义词的词义,,这是这些机器翻译系统译文质量低劣的主要原因之一。


网友评论