文件名称:中文预训练词向量(百度百科 word2vec +Ngram)-数据集
文件大小:552.86MB
文件格式:ZIP
更新时间:2024-04-18 23:22:55
数据集
中文预训练词向量北京师范大学中文信息处理研究所与中国人民大学 DBIIR 实验室的研究者开源的"chinese-word-vectors。github链接为:https://github.com/Embedding/Chinese-Word-Vectors。
此中文预训练词向量为百度百科Word + Ngram的词向量,可以直接从https://github.com/Embedding/Chinese-Word-Vectors下载。
【文件预览】:
sgns.target.word-ngram.1-2.dynwin5.thr10.neg5.dim300.iter5.bz2.zip