文件名称:WSSTG:该存储库包含WSSTG(ACL 2019)中引入的主要基准
文件大小:2.32MB
文件格式:ZIP
更新时间:2024-05-25 18:22:53
Python
弱监督时空的自然句子在视频中 此仓库包含WSSTG中引入的VID语句数据集的主要基线。 有关VID语句数据集的信息,请参阅和。 任务 描述:“一只棕色和白色的狗躺在草地上,然后站起来。” 提出的WSSTG任务旨在在视频中定位一个时空管(即绿色边框的序列),该管在语义上与给定的句子相对应,而在训练过程中不依赖任何时空注释。 建筑学 所提出方法的体系结构。 内容 要求:软件 Pytorch(版本= 0.4.0) python 2.7 麻木 科学的 魔法 易言 莳萝 matplotlib 张量板 安装 克隆WSSTG存储库和VID语句存储库 git clone https://github.com/JeffCHEN2017/WSSTG.git git clone https://github.com/JeffCHEN2017/VID-Sentence.git ln
【文件预览】:
WSSTG-master
----images()
--------frm.png(368KB)
--------task.png(618KB)
----fun()
--------lossPackage.py(4KB)
--------image_toolbox.py(4KB)
--------__init__.py(0B)
--------eval.py(4KB)
--------optimizers.py(560B)
--------netUtil.py(6KB)
--------evalDet.py(12KB)
--------datasetLoader.py(3KB)
--------datasetParser.py(9KB)
--------modelArc.py(20KB)
--------dashed_rect.py(1KB)
--------vidDatasetParser.py(20KB)
--------wsParamParser.py(8KB)
--------create_word2vec_for_dataset.py(4KB)
--------vidDataset.py(33KB)
--------classSST.py(13KB)
--------logInfo.py(446B)
--------train.py(8KB)
----data()
--------__init__.py(0B)
--------dictForDb_vid_v2.pd(7.06MB)
--------data_loader.py(172B)
----LICENSE(19KB)
----util()
--------__init__.pyc(106B)
--------__init__.py(0B)
--------mytoolbox.pyc(16KB)
--------base_parser.pyc(1KB)
--------base_parser.py(1KB)
--------mytoolbox.py(14KB)
--------get_image_size.py(13KB)
----scripts()
--------test_video_emb_att.sh(671B)
--------train_video_emb_att.sh(690B)
----README.md(4KB)
----readme.md(136B)
----annotations()
--------script_test_annotation.py(7KB)
--------utils.py(2KB)
--------ptd_api.py(8KB)