collaborative-experts:视频嵌入,可通过自然语言查询进行检索

时间:2024-05-22 13:14:07
【文件属性】:

文件名称:collaborative-experts:视频嵌入,可通过自然语言查询进行检索

文件大小:4.24MB

文件格式:ZIP

更新时间:2024-05-22 13:14:07

deep-neural-networks video-retrieval Python

此仓库提供以下代码: TeachText利用来自多个文本编码器的补充提示,使用通用蒸馏设置()为检索模型提供增强的监督信号。 TeachText模型的文件和权重即将发布。 学习和评估视频文本联合嵌入以实现视频检索任务。 该方法在论文“使用现有资源:使用来自协作专家的表示的视频检索”中进行了描述(,) CVPR 2020五项全能挑战赛 要求:该代码假定使用PyTorch 1.4和Python 3.7(其他版本可能有效,但尚未经过测试)。 有关特定的软件包要求,请参见本文件末尾有关依赖性的部分。 教学文字 MSRVTT基准测试的TeachText结果 模型 分裂 任务 R @ 1 R @ 5 R @ 10 R @ 50 磁电阻 锰铁 几何 CE认证 满的 t2v 11.0 (0.0) 30.8 (0.1) 43.3 (0.3) 73.1 (0.2) 15.0 (0.0


网友评论