文件名称:PTB文本数据集
文件大小:33.78MB
文件格式:ZIP
更新时间:2022-04-20 05:29:29
PTB NLP
PTB(Penn Treebank Dataset)文本数据集是语言模型学习中目前最广泛使用的数据集。
【文件预览】:
simple-examples
----7-dynamic-evaluation()
--------train.sh(2KB)
--------test.sh(3KB)
--------README(551B)
----models()
--------swb.rnn.model(53.96MB)
--------README(167B)
--------swb.ngram.model(19.12MB)
----6-recovery-during-training()
--------train.sh(2KB)
--------test.sh(920B)
--------README(335B)
----rnnlm-0.2b()
--------convert.c(885B)
--------example.output(2KB)
--------train(330KB)
--------rnnlmlib.h(6KB)
--------test(34KB)
--------valid(29KB)
--------COPYRIGHT.txt(1KB)
--------makefile(411B)
--------example.sh(813B)
--------CHANGE.log(1KB)
--------prob.c(745B)
--------rnnlmlib.cpp(49KB)
--------FAQ.txt(8KB)
--------rnnlm.cpp(14KB)
----2-nbest-rescore()
--------makenbest.c(426B)
--------getbest(6KB)
--------getbest.c(1KB)
--------makenbest(6KB)
--------lattices()
--------README(3KB)
--------gettext.c(552B)
--------gettext(6KB)
----data()
--------ptb.char.valid.txt(768KB)
--------ptb.valid.txt(390KB)
--------ptb.train.txt(4.87MB)
--------ptb.test.txt(439KB)
--------ptb.char.train.txt(9.57MB)
--------ptb.char.test.txt(864KB)
--------README(609B)
----5-one-iter()
--------train.sh(3KB)
--------test.sh(920B)
--------README(368B)
----temp()
----9-char-based-lm()
--------train.sh(2KB)
--------test.sh(957B)
--------README(1KB)
----3-combination()
--------train.sh(3KB)
--------test.sh(3KB)
--------README(96B)
----4-data-generation()
--------train.sh(2KB)
--------test.sh(2KB)
--------README(452B)
----1-train()
--------train.sh(2KB)
--------test.sh(1KB)
--------README(211B)
----8-direct()
--------train.sh(3KB)
--------test.sh(2KB)
--------README(1013B)