VLP:图像字幕和问答的视觉语言预训练下载

【文件属性】：

文件名称：VLP:图像字幕和问答的视觉语言预训练

文件大小：828KB

文件格式：ZIP

更新时间：2024-06-18 03:39:40

Python

VLP 这个 repo 托管了我们 AAAI2020 工作的源代码。我们已经发布了数据集上的预训练模型，以及用于图像字幕的 COCO Captions 和 Flickr30k 以及 VQA 的 VQA 2.0 上的微调模型。安装 Conda 环境（选项 I，推荐）递归 ssh 克隆 repo 以包含coco和pythia子模块。 git clone --recursive git@github.com:LuoweiZhou/VLP.git 或使用 https 克隆： git clone --recursive https://github.com/LuoweiZhou/VLP.git 安装 CUDA（例如 10.0）、CUDNN（例如 v7.5）和（Miniconda2 或 3，版本 4.6+）。运行以下命令来设置 conda env 并安装 Python 包：

立即下载

【文件预览】：
VLP-master
----.gitmodules(192B)
----misc()
--------data_parallel.py(5KB)
--------vlp_teaser.png(770KB)
--------__init__.py(0B)
--------vlp.yml(2KB)
----vlp()
--------decode_img2txt.py(12KB)
--------scst_utils.py(2KB)
--------run_img2txt_dist.py(31KB)
--------seq2seq_loader.py(22KB)
--------loader_utils.py(939B)
--------__init__.py(0B)
--------lang_utils.py(2KB)
--------eval_vqa2.py(12KB)
----pytorch_pretrained_bert()
--------loss.py(2KB)
--------tokenization.py(15KB)
--------__main__.py(954B)
--------__init__.py(591B)
--------optimization.py(18KB)
--------file_utils.py(8KB)
--------modeling.py(96KB)
--------optimization_fp16.py(4KB)
----coco-caption()
----Dockerfile(1KB)
----LICENSE(24KB)
----pythia()
----.gitignore(1KB)
----README.md(18KB)
----setup.sh(1KB)

秒客网

VLP:图像字幕和问答的视觉语言预训练

网友评论

相关文章