文件名称:现代汉语语料库
文件大小:25.77MB
文件格式:RAR
更新时间:2022-05-10 01:03:24
中文语料库 分词 词性标注 现代汉语 语料库
语言所公开的现代汉语语料库,通过分别查询3500个常用汉字,将所有数据进行清洗去重后的集合。共554026行,解压后约93.8M,带分词和词性标注。
【文件预览】:
corpus_cn_tag.txt
文件名称:现代汉语语料库
文件大小:25.77MB
文件格式:RAR
更新时间:2022-05-10 01:03:24
中文语料库 分词 词性标注 现代汉语 语料库
语言所公开的现代汉语语料库,通过分别查询3500个常用汉字,将所有数据进行清洗去重后的集合。共554026行,解压后约93.8M,带分词和词性标注。