自然语言处理-条件随机场工具集

时间:2023-04-11 22:40:15
【文件属性】:

文件名称:自然语言处理-条件随机场工具集

文件大小:1.22MB

文件格式:ZIP

更新时间:2023-04-11 22:40:15

自然语言处理

自然语言处理、条件随机场 运用字标注法进行中文分词,对语料进行字标注,观察分词效果。开源的条件随机场工具包“CRF++: Yet Another CRF toolkit”进行分词。 可以使用的中文语料资源是SIGHAN提供的backoff 2005语料,目前封闭测试最好的结果是4-tag+CFR标注分词,在北大语料库上可以在准确率,召回率以及F值上达到92%以上的效果,在微软语料库上可以到达96%以上的效果。


【文件预览】:
crfpp
----CRF++-0.58 接口板.rar(1.23MB)
----readme.txt(567B)

网友评论

相关文章