Penn Tree Bank(PTB文本数据集)

时间:2021-02-12 07:28:48
【文件属性】:

文件名称:Penn Tree Bank(PTB文本数据集)

文件大小:93.28MB

文件格式:TAR

更新时间:2021-02-12 07:28:48

tensorflow RNN PTB

来源于 Tomas Mikolov 网站上的 PTB 数据集http://www.fit.vutbr.cz/~imikolov/rnnlm/simple-examples.tgz。 该数据集已经预先处理过并且包含了全部的 10000 个不同的词语,其中包括语句结束标记符,以及标记稀有词语的特殊符号 () 。我们在 reader.py 中转换所有的词语,让他们各自有唯一的整型标识符,便于神经网络处理。


网友评论

  • 数据还是挺好的
  • 虽然没用到,很好