ParagraphVec:在 CUDA 上实现段落向量

时间:2024-07-13 16:22:07
【文件属性】:

文件名称:ParagraphVec:在 CUDA 上实现段落向量

文件大小:46.67MB

文件格式:ZIP

更新时间:2024-07-13 16:22:07

Python

#ParagraphVec# CSCI-GA.3033-004 图形处理单元 (GPU) 的项目提交:架构和编程。 段落向量算法的CUDA实现。 只是实现了 PV-DBOW 模型(Paragraph Vector Distributed Bag of Words)。 预计您已经使用 word2vec 的 gensim 版本训练了词向量。 但是,我计划实现一个版本,它只需要任何语料库并生成词向量和文档向量。 #在纽约大学 CUDA 集群上运行的说明# 将实现复制到适当的目录。 $git clone https://github.com/darshanhegde/ParagraphVec 我已经在 cuda1 集群上运行了所有的实验。 我正在使用 PyCUDA 进行我的实现。 cuda1 上的 PyCUDA 使用 5.5 的 CUDA SDK 版本。 加载 CUDA SDK


【文件预览】:
ParagraphVec-master
----final_report.pdf(257KB)
----results()
--------nn_sentences_result.txt(10KB)
----src()
--------find_nearest_neighbour.py(4KB)
--------paragraph_vector.py(12KB)
----model()
--------syn1.pkl(71.55MB)
--------words_rep.pkl(27.41MB)
----LICENSE(1KB)
----model_sub()
--------README.txt(33B)
----README.md(2KB)
----data()
--------nn_sentences.txt(909B)
--------nn_sentences_result.txt(10KB)
--------paragraph_data.txt(23.26MB)
----.gitignore(714B)

网友评论