文件名称:LSTM神经网络训练的PTB语料
文件大小:3.26MB
文件格式:RAR
更新时间:2022-04-27 08:55:43
PTB 华尔街语料库 神经网络训练
NLP中常用的PTB语料库,全名Penn Treebank。 Penn Treebank是一个项目的名称,项目目的是对语料进行标注,标注内容包括词性标注以及句法分析。 语料来源为:1989年华尔街日报 语料规模:1M words,2499篇文章
【文件预览】:
data
----ptb.test.txt(439KB)
----ptb.char.test.txt(864KB)
----ptb.train.txt(4.87MB)
----ptb.char.valid.txt(768KB)
----ptb.char.train.txt(9.57MB)
----ptb.valid.txt(390KB)
----README(609B)