文件名称:复旦中文文本分类语料库.zip
文件大小:52.33MB
文件格式:ZIP
更新时间:2023-09-16 02:38:15
文本分类 语料
本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。(使用时尽量注明来源(复旦大学计算机信息与技术系国)
文件名称:复旦中文文本分类语料库.zip
文件大小:52.33MB
文件格式:ZIP
更新时间:2023-09-16 02:38:15
文本分类 语料
本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。(使用时尽量注明来源(复旦大学计算机信息与技术系国)