chinese_word_segment_data.rar

时间:2022-12-08 17:10:13
【文件属性】:

文件名称:chinese_word_segment_data.rar

文件大小:123.44MB

文件格式:RAR

更新时间:2022-12-08 17:10:13

分词 词性标注 中文 数据

chinese_word_segment_data.rar,几个常见的中文分词词性标注数据,找了好多地方呢,有pku, icwb2,nlpcc2016和syj_trainCorpus的


【文件预览】:
chinese_word_segment_data
----seg_syj_trainCorpus_utf8_jiqi()
--------syj_trainCorpus_utf8.txt(264.39MB)
--------readme.txt(1KB)
----nlpcc2016_word_segnment()
--------nlpcc2016-wordseg-test.dat(28KB)
--------nlpcc2016-word-seg-train.dat(2.5MB)
--------evel.txt(605B)
----icwb2-data()
--------training()
--------testing()
--------README(2KB)
--------doc()
--------scripts()
--------gold()
----pku98()
--------199801-train.txt(7.79MB)
--------199801-test.txt(812KB)
--------199801.txt(8.59MB)
--------README.md(2KB)

网友评论