*中文语料word2vec训练后结果

时间:2020-06-23 15:11:03
【文件属性】:

文件名称:*中文语料word2vec训练后结果

文件大小:234B

文件格式:ZIP

更新时间:2020-06-23 15:11:03

wiki中文

中文*语料库,将其转换为文本文件后,进行繁体字转换为简体字,字符集转换,分词,然后训练得到模型以及向量。由于文件上传的大小限制是60MB,而训练后的所有文件大小有1G以上,所以这里只提供了下载链接,地址在网盘中。使用python中的gensim包进行训练得到的,运行时间较长,纯粹的*中文语料训练后的结果,拿去可以直接使用。


【文件预览】:
wiki.zh.text.vector_url

网友评论

  • 链接失效,无法下载
  • 您说可以看您博客,但是我找了一下却没有看到呀,您能发下链接吗 不发这资源就是白下的了 另外 还特别想要您处理后的中文语料 就是没有经过分词的 您如果还有 方便的话麻烦您也给我发一份
  • 可以的模型
  • 还没使用。。等下试试
  • 请问一下四个文件分别是什么用处啊?
  • 你不是说这是训练后的模型吗,就是因为自己训练内存溢出才来下你的资源的呀o(╥﹏╥)o
  • 非常好方法
  • 我下载了,只有一个URL,不知道怎么用
  • 介绍一下各个文件使用方法更好了,还是感谢
  • 刚好在学习 Gensim 谢谢!