文件名称:coNLL2004数据集
文件大小:4.71MB
文件格式:GZ
更新时间:2012-08-01 11:07:32
coNLL2004 数据集 conll
机器学习或采用统计模型如HMM,MEMM,CRF等训练时需要的数据集,具体使用方法请看里面的README,一定要看仔细了,里面有很多的小压缩包,完整的train.txt或text.txt要在linux下用命令生成
【文件预览】:
conll04st-release
----synt.dev.pred.gz(66KB)
----ne.train.pred.gz(32KB)
----senses.dev.gz(8KB)
----props.dev.gz(107KB)
----pb-frames.tar.gz(2.32MB)
----words.test.gz(116KB)
----baseline.pl(5KB)
----props.test.gz(89KB)
----ne.test.pred.gz(6KB)
----senses.test.gz(7KB)
----words.train.gz(611KB)
----synt.train.pred.gz(296KB)
----ne.dev.pred.gz(8KB)
----senses.train.gz(34KB)
----words.dev.gz(140KB)
----CHANGES.PB(4KB)
----synt.dev.gold.gz(67KB)
----srl-eval.pl(35KB)
----synt.test.pred.gz(57KB)
----README(14KB)
----CHANGES(3KB)
----synt.train.gold.gz(297KB)
----props.train.gz(471KB)
----targets.test.gz(14KB)