文件名称:doc2vec:使用Python 3,Keras和TensorFlow的doc2vec的简单易读实现
文件大小:12KB
文件格式:ZIP
更新时间:2024-05-23 09:27:17
Python
doc2vec 使用Python 3,Keras和TensorFlow的doc2vec [1]的简单易读实现。 安装 pip install -r requirements.txt python setup.py install 假设条件 此实现假定您的文档都在同一目录中,并以单调递增的整数ID命名,例如0.txt , 1.txt 。 每个文件都应包含一个普通的文本文档,即没有任何特殊的预处理。 用法 doc2vec path/to/docs/ \ --save path/to/save/model.hdf5 \ --save_vocab path/to/save/vocab.vocab \ --train 默认情况下,这将使用分布式内存(DM)模型。 您还可以将“分布式词袋”(DBOW)模型用于: doc2vec path/to/docs/ --model d
【文件预览】:
doc2vec-master
----.gitignore(196B)
----README.md(1KB)
----LICENSE(1KB)
----script()
--------setup.sh(156B)
----doc2vec()
--------doc2vec.py(5KB)
--------vocab.py(2KB)
--------script()
--------model()
--------__init__.py(0B)
--------data()
----requirements.txt(394B)
----setup.py(838B)
----.python-version(19B)