VOLSUNGA算法-文本挖掘PPT

时间:2024-05-15 19:45:07
【文件属性】:

文件名称:VOLSUNGA算法-文本挖掘PPT

文件大小:406KB

文件格式:PPT

更新时间:2024-05-15 19:45:07

文本挖掘

VOLSUNGA算法 VOLSUNGA算法对CLAWS算法的改进主要有两个方面 在最佳路径的选择方面,不是最后才来计算概率积最大的标记串,而是沿着从左至右的方向,采用“步步为营”的策略,对于当前考虑的词,只保留通往该词的最佳路径,舍弃其他路径,然后再从这个词出发,将这个路径同下一个词的所有标记进行匹配,继续找出最佳的路径,舍弃其他路径,这样一步一步地前进,直到整个跨段走完,得出整个跨段的最佳路径作为结果输出。 根据语料库统计出每个词的相对标注概率(Relative Tag Probability),并用这种相对标注概率来辅助最佳路径的选择。 VOLSUNGA算法大大地降低了CLAWS算法的时间复杂度和空间复杂度,提高了自动词性标注的准确率。


网友评论