文件名称:ZeroShotVideoClassification:通过3D卷积神经网络的端到端训练实现零镜头视频分类
文件大小:26KB
文件格式:ZIP
更新时间:2024-05-14 00:32:35
Python
介绍 论文的官方代码 Rethinking Zero-shot Video Classification: End-to-end Training for Realistic Applications 在上。 概括 了解可以推广到看不见的动作的视频表示。 语义信息用作监督。 特别地,视觉表示被映射到Word2Vec嵌入中,在语义上相关的单词在欧几里得意义上彼此更接近。 检查点 可以在下载用于生成论文编号的经过训练的模型。 安装 要求 运行install.sh以获取不常见的库(faiss,tensorboardx,joblib)以及与docker中安装的cuda 9.2兼容的pytorch的最新版本。 检索外部资产 获取word2vec模型 sudo chmod + assets/download_word2vec.sh ./assets/download_word2vec.sh 获取C3D
【文件预览】:
ZeroShotVideoClassification-master
----main.py(15KB)
----assets()
--------download_word2vec.sh(264B)
----dataset.py(9KB)
----LICENSE(11KB)
----install.sh(1KB)
----auxiliary()
--------transforms.py(5KB)
--------auxiliary_activitynet.py(5KB)
--------auxiliary_stillimages.py(6KB)
--------auxiliary_word2vec.py(7KB)
--------auxiliary_dataset.py(8KB)
----run.sh(335B)
----.gitignore(40B)
----README.md(3KB)
----network.py(5KB)