文件名称:Brown语料库和LOB语料库
文件大小:5.46MB
文件格式:RAR
更新时间:2023-11-07 04:06:29
Brown LOB 语料库
Brown语料库是世界上第一个计算机可读的语料库,它搜集的语料来自1961年美国英语出版物上的文本,共500篇,每篇大约2000个单词,合计100万单词。LOB语料库是模仿Brown语料库的比例建立起来的英国英语语料库,其预料搜集自1961年英国英语出版物上的文本,共500篇,每篇大约2000个单词,合计100万单词。Brown语料库带词性标记,LOB语料库不带词性标记。
【文件预览】:
Brown语料库和LOB语料库
----brown.zip(3.16MB)
----LOB.rar(2.35MB)