深度矢量量化:VQVAE,GumbelSoftmaxes和朋友

时间:2024-03-24 01:27:14
【文件属性】:

文件名称:深度矢量量化:VQVAE,GumbelSoftmaxes和朋友

文件大小:278KB

文件格式:ZIP

更新时间:2024-03-24 01:27:14

JupyterNotebook

深度矢量量化 实现VQVAE的培训代码,即具有分类潜在变量瓶颈的自动编码器,然后可以轻松地将其插入到现有基础结构中,以对离散变量序列(GPT和朋友)建模。 dvq/vqvae.py是训练脚本的入口点,可以称为一次小型训练运行,例如: cd dvq; python vqvae.py --gpus 1 --data_dir /somewhere/to/store/cifar10 这将使用CIFAR-10上的一个半小型网络来复制原始DeepMind VQVAE论文(请参阅之前的参考资料)。 此仓库上的工作仍在进行中,目前需要阅读代码并理解这些方法。 接下来,旨在重现DALL-E的结果,因为大多数代码已经到位,但是我们需要使用logit laplace分布进行训练,调整gumbel softmax超参数,并在ImageNet +上进行训练。 参考 DeepMind的 可以使用--vq_fla


【文件预览】:
deep-vector-quantization-main
----.gitignore(1KB)
----requirements.txt(72B)
----visualize.ipynb(352KB)
----LICENSE(1KB)
----dvq()
--------data()
--------model()
--------__init__.py(0B)
--------vqvae.py(9KB)
----README.md(2KB)

网友评论