omeganet:从视频中提取语义以全面了解场景[CVPR 2020]

时间:2024-05-24 12:42:14
【文件属性】:

文件名称:omeganet:从视频中提取语义以全面了解场景[CVPR 2020]

文件大小:10.62MB

文件格式:ZIP

更新时间:2024-05-24 12:42:14

Python

提炼了语义,可以从视频中全面了解场景 在发布的演示代码“用于从视频中全面了解场景的提炼语义” - - 作者 - - -- -- †联合第一作者 目前,我们不打算发布培训代码。 抽象的 全面了解周围环境对于自治系统至关重要。 最近的工作表明,深度神经网络可以从单眼视频中学习几何形状(深度)和运动(光流),而无需地面真相注释的任何明确监督,尤其是这两项任务很难获得。 在本文中,我们通过学习深度和运动以及语义,并通过单眼相机向整体场景理解又迈出了一步,并通过预训练的网络提取代理地面真相图像对后者进行监督。 我们通过以下两种方式共同解决这三个任务:a)基于知识提炼和自我监督的新颖训练协议,b)紧凑的网络体系结构,可在耗电的GPU和低功耗的嵌入式平台上实现高效的场景理解。 我们对框架的性能进行了全面评估,并表明该框架可产生用于单眼深度估计,光流和运动分割的最新结果。 建筑学 在培训


【文件预览】:
omeganet-master
----testers()
--------kitti_mask.py(3KB)
--------factory.py(1KB)
--------error_tester.py(1KB)
--------kitti_depth.py(3KB)
--------__init__.py(0B)
--------general_tester.py(1KB)
--------kitti_flow.py(4KB)
--------kitti_semantic.py(3KB)
----.gitignore(45B)
----filenames()
--------eigen_test.txt(46KB)
--------kitti_2015_test_semantic.txt(3KB)
--------kitti_2015_test.txt(8KB)
----README.md(10KB)
----networks()
--------selflow()
--------baseline.py(7KB)
--------ops.py(5KB)
--------complete_network.py(8KB)
--------network_components.py(14KB)
--------__init__.py(0B)
--------general_network.py(2KB)
----test.py(5KB)
----dataloaders()
--------general_dataloader.py(2KB)
--------factory.py(1KB)
--------dataloader_three_frames.py(2KB)
--------dataloader_one_frame.py(2KB)
--------__init__.py(0B)
----LICENSE(11KB)
----single_inference.py(10KB)
----evaluators()
--------semantic.py(7KB)
--------depth.py(4KB)
--------mask.py(7KB)
--------flow.py(2KB)
--------__init__.py(683B)
----requirements.txt(157B)
----helpers()
--------depth_utils.py(8KB)
--------__init__.py(0B)
--------bilinear_sampler.py(12KB)
--------utilities.py(16KB)
--------flow_tool()
----assets()
--------spotlight.mp4(2.3MB)
--------poster.pdf(4.91MB)
--------architecture.png(356KB)
--------banner.gif(1.01MB)
--------example()

网友评论