文件名称:word2vec-cython:word2vec算法的cython实现(利用负采样和欠采样)
文件大小:6KB
文件格式:ZIP
更新时间:2024-03-05 15:11:16
Python
该存储库包含word2vec模型的实现,该模型利用了负采样和欠采样(如神经网络类中的项目所使用的),语料库处理脚本和在硬编码文件路径上运行该模型的脚本来语料库。 我感谢Stanford CS224n课程的老师,在此课程中,我开发了word2vec模型的第一个纯python实现,以及gensim的创建者RadimŘehůřek,在我优化模型时,我的代码也随之实现(现在,训练代码的“功能”几乎等于gensim的实现,并且在理论上也表现最佳。
【文件预览】:
word2vec-cython-master
----setup.py(239B)
----training.pxd(615B)
----training.pyx(5KB)
----voidptr.h(310B)
----corpus.py(4KB)
----README.md(693B)
----word2vec2wiki.pyx(4KB)