WuDaoCorpus:先前全球最大的中文语料库

时间:2024-03-30 06:31:24
【文件属性】:

文件名称:WuDaoCorpus:先前全球最大的中文语料库

文件大小:2KB

文件格式:ZIP

更新时间:2024-03-30 06:31:24

五道集团 2020年10月,北京智源人工智能研究院(以下简称“智源研究院”)组织发起攻关团队,启动超大规模预训练模型研发项目“悟道”,逐步引入大型模型领域自主研发的空白。作为“悟道”项目的支撑,智源研究院联合清华大学,搜狗,中国人民大学,360等发布的版本最大。数据集申请下载链接


【文件预览】:
WuDaoCorpus-main
----.gitignore(2KB)
----README.md(595B)

网友评论