VLP:图像字幕和问答的视觉语言预训练

时间:2024-06-18 03:39:40
【文件属性】:

文件名称:VLP:图像字幕和问答的视觉语言预训练

文件大小:828KB

文件格式:ZIP

更新时间:2024-06-18 03:39:40

Python

VLP 这个 repo 托管了我们 AAAI2020 工作的源代码。 我们已经发布了数据集上的预训练模型,以及用于图像字幕的 COCO Captions 和 Flickr30k 以及 VQA 的 VQA 2.0 上的微调模型。 安装 Conda 环境(选项 I,推荐) 递归 ssh 克隆 repo 以包含coco和pythia子模块。 git clone --recursive git@github.com:LuoweiZhou/VLP.git 或使用 https 克隆: git clone --recursive https://github.com/LuoweiZhou/VLP.git 安装 CUDA(例如 10.0)、CUDNN(例如 v7.5)和 (Miniconda2 或 3,版本 4.6+)。 运行以下命令来设置 conda env 并安装 Python 包:


【文件预览】:
VLP-master
----.gitmodules(192B)
----misc()
--------data_parallel.py(5KB)
--------vlp_teaser.png(770KB)
--------__init__.py(0B)
--------vlp.yml(2KB)
----vlp()
--------decode_img2txt.py(12KB)
--------scst_utils.py(2KB)
--------run_img2txt_dist.py(31KB)
--------seq2seq_loader.py(22KB)
--------loader_utils.py(939B)
--------__init__.py(0B)
--------lang_utils.py(2KB)
--------eval_vqa2.py(12KB)
----pytorch_pretrained_bert()
--------loss.py(2KB)
--------tokenization.py(15KB)
--------__main__.py(954B)
--------__init__.py(591B)
--------optimization.py(18KB)
--------file_utils.py(8KB)
--------modeling.py(96KB)
--------optimization_fp16.py(4KB)
----coco-caption()
----Dockerfile(1KB)
----LICENSE(24KB)
----pythia()
----.gitignore(1KB)
----README.md(18KB)
----setup.sh(1KB)

网友评论