中文命名实体识别语料(MSRA+人民日报+Boson)

时间:2022-12-01 09:46:29
【文件属性】:

文件名称:中文命名实体识别语料(MSRA+人民日报+Boson)

文件大小:5.39MB

文件格式:RAR

更新时间:2022-12-01 09:46:29

data

适合作为命名实体识别的补充预料,包括微软亚研院MSRA:46365条语料、人民日报:23061条语料和Boson:2000条语料。都是标注过的,非常实用,适合新手作为刚开始的模型练习。


【文件预览】:
ChineseNER-data
----renMinRiBao()
--------renmin.txt(10.18MB)
----MSRA()
--------train1.txt(9.99MB)
--------test1.txt(514KB)
----boson()
--------origindata.txt(1.78MB)

网友评论