word2vecVN:越南语的预训练Word2Vec模型

时间:2021-05-31 10:10:19
【文件属性】:
文件名称:word2vecVN:越南语的预训练Word2Vec模型
文件大小:509KB
文件格式:ZIP
更新时间:2021-05-31 10:10:19
Python 一、word2vecVN 越南语 Word2Vec 模型 下载模型: 在越南语 Wiki 上训练的模型: 。 在 Le 等人的数据(窗口大小 5、400 暗)上训练的模型: 。 在 Le 等人的数据(窗口大小 2、300 暗)上训练的模型: 。 可视化: word2vec-visualization(使用 TensorBoard): 下载 tf_files: 运行 $ tensorboard --log_dir=./ --port=10001 word2vec-simple-visualization:运行良好。 请阅读该文件夹中的自述文件以了解如何测试模型。 笔记: 该模型使用 Le 等人的数据进行训练。 数据信息:7.1G 文本,包含 974,393,244 个原始词和 97,440 个文档的语料库中的 1,675,819 个唯一词。 请注意,所有单词都是标记词。 二
【文件预览】:
word2vecVN-master
----other-models-n-examples()
--------spacy-fastext.py(2KB)
----images()
--------w2vecVN_tb.png(167KB)
--------spacy_example.png(219KB)
----LICENSE(11KB)
----README.md(3KB)
----word2vec-visualization()
--------README.md(3KB)
----word2vec-simple-visualization()
--------outof_w2vec.dict(298B)
--------images()
--------__init__.py(0B)
--------README.md(790B)
--------Main.py(2KB)
--------data()
--------templates()
--------static()

网友评论