文件名称:谷歌师兄的leetcode刷题笔记-word2vec:谷歌Word2vec源代码
文件大小:104KB
文件格式:ZIP
更新时间:2024-07-20 01:25:37
系统开源
谷歌师兄的leetcode刷题笔记Word2vec 谷歌 Word2Vec 存储库的这个分支可在 MacOS X Sierra 上编译 如何构建 word2vec 构建word2vec , word2phrase , word-analogy , compute-accuracy , distance二进制文件 $ git clone https://github.com/loretoparisi/word2vec.git $ cd word2vec $ ./make 要运行单词演示示例, text8从以下位置训练示例语料库text8 ./demo-word.sh 运行短语演示示例,训练单语 (en) 2012 news语料库来自 ./demo-phrases.sh 笔记。 您可以修改此脚本以训练不同的语言 关于 我们提供了连续词袋 (CBOW) 和 Skip-gram 模型 (SG) 的实现,以及几个演示脚本。 给定一个文本语料库,word2vec 工具使用连续词袋或 Skip-Gram 神经网络架构为词汇表中的每个词学习一个向量。 用户应指定以下内容: 所需的向量维数 Skip-G
【文件预览】:
word2vec-master
----questions-phrases.txt(164KB)
----demo-classes.sh(358B)
----word2vec.c(26KB)
----demo-word-accuracy.sh(414B)
----distance.c(5KB)
----demo-train-big-model-v1.sh(5KB)
----demo-analogy.sh(631B)
----word2phrase.c(9KB)
----LICENSE(1KB)
----demo-phrase-accuracy.sh(885B)
----makefile(718B)
----word-analogy.c(5KB)
----compute-accuracy.c(5KB)
----.gitignore(424B)
----questions-words.txt(590KB)
----demo-word.sh(286B)
----README.md(6KB)
----demo-phrases.sh(853B)