文件名称:msra(命名实体语料) BIO schema.zip
文件大小:6.53MB
文件格式:ZIP
更新时间:2024-04-05 07:37:01
NLP 语料 NER
2006年,微软亚洲研究院(Microsoft Research Asia, MSRA)发布的BIO格式标注语料,共计46365条。
【文件预览】:
msra(命名实体语料) BIO schema
----original()
--------link.txt(49B)
--------train1.txt(9.99MB)
--------test1.txt(514KB)
--------testright1.txt(564KB)
----train_data(13.26MB)
----test_data(1.06MB)