基于标签和语言模型的分词算法

时间:2020-10-30 17:10:29
【文件属性】:

文件名称:基于标签和语言模型的分词算法

文件大小:7KB

文件格式:PY

更新时间:2020-10-30 17:10:29

分词

宗成庆书里面准确率最高的分词算法,代码有点错误,[c t]分母上的统计量应该是统计前几个字出现的字数而不是自身的个数,修改就可以进行分词,细节看里面的标注,参照给出的语料可以使用


网友评论