文件名称:Word2Vec.jl:Julia 中的 Word2Vec
文件大小:353KB
文件格式:ZIP
更新时间:2024-06-23 14:08:46
Julia
Word2Vec 创建一个WordEmbedding实例: embed = WordEmbedding(100, Word2Vec.random_inited, Word2Vec.huffman_tree, subsampling = subsampling) 顺序训练: train(embed, inputfile) 或者,并行训练: 添加工作节点: addprocs(N) 使用Blocks对输入文件进行分Blocks : b = Block(File(inputfile), nworkers()) 开始训练块,同时提供一个文件名,用于在工作节点和主节点之间交换数据: train(embed, b, "/tmp/emb") 训练成功后,查询相似词: find_nearest_words(embed, "query words") 这仍在进行中。 使用权重平均的并行训练不会
【文件预览】:
Word2Vec.jl-master
----.gitignore(18B)
----src()
--------Word2Vec.jl(498B)
--------utils.jl(607B)
--------word_stream.jl(2KB)
--------tree.jl(1KB)
--------softmax_classifier.jl(3KB)
--------train.jl(12KB)
--------query.jl(1KB)
----LICENSE.md(1KB)
----.travis.yml(350B)
----REQUIRE(63B)
----README.md(1KB)
----test()
--------test_parallel.jl(2KB)
--------data()
--------test_utils.jl(729B)
--------test_embedding.jl(1KB)
--------test_softmax.jl(1KB)
--------runtests.jl(110B)