文件名称:sighan 2006 MSRA命名实体语料(BIO格式)
文件大小:7.18MB
文件格式:ZIP
更新时间:2021-09-19 17:54:32
NER BIO格式 bakeoff2006 MSRA语料
2006年sighan命名实体识别任务语料,MSRA提供。已经转成BIO格式,可直接用于NER训练
【文件预览】:
msra(命名实体语料) BIO schema
----original()
--------train1.txt(9.99MB)
--------test1.txt(514KB)
--------link.txt(49B)
--------testright1.txt(564KB)
----test_data(1.06MB)
----train_data(13.26MB)