文件名称:stereo-from-mono:[ECCV 2020]使用单眼深度估计网络从单个图像学习立体
文件大小:13.86MB
文件格式:ZIP
更新时间:2024-04-20 19:29:05
deep-learning stereo deeplearning stereo-algorithms stereo-matching
( ,奥达( ,托夫( ,( 和( – ECCV 2020(口头报告) 受监督的深层网络是在立体图像对中找到对应关系的最佳方法之一。 像所有监督方法一样,这些网络在训练期间需要地面真实数据。 但是,收集大量准确而密集的对应数据非常具有挑战性。 我们建议,不必高度依赖地面真实深度甚至对应的立体声对。 受单眼深度估计的最新进展启发,我们从单个图像生成了合理的视差图。 反过来,我们在精心设计的管道中使用那些有缺陷的视差图生成立体声训练对。 以这种方式进行训练可以将任何单个RGB图像集合转换为立体声训练数据。 这样就大大减少了工作量,而无需收集实际深度或手工设计合成数据。 因此,我们可以从头开始在像COCO这样的数据集上训练从头开始的立体声匹配网络,这些数据以前很难用于立体声。 通过广泛的实验,我们证明了在KITTI,ETH3D和Middlebury上进行评估时,我们的方法优于使用标
【文件预览】:
stereo-from-mono-master
----networks()
--------psm_submodules.py(9KB)
--------__init__.py(47B)
--------psm_hourglass.py(7KB)
----options.py(6KB)
----splits()
--------diw()
--------mapillary()
--------middlebury()
--------kitti()
--------eth3d()
--------diode()
--------sceneflow()
--------mscoco()
--------ADE20K()
--------flicker()
----paths_config.yaml(362B)
----main.py(434B)
----model_manager.py(4KB)
----utils.py(2KB)
----inference.py(7KB)
----assets()
--------results.png(799KB)
--------table.png(106KB)
--------method.png(364KB)
--------2min.png(385KB)
--------teaser.png(827KB)
--------10min.png(386KB)
----LICENSE(8KB)
----trainer.py(12KB)
----README.md(5KB)
----datasets()
--------ade20k_dataset.py(3KB)
--------middlebury_dataset.py(2KB)
--------mapillary_dataset.py(3KB)
--------sceneflow_dataset.py(7KB)
--------eth3d_dataset.py(2KB)
--------mscoco_dataset.py(3KB)
--------warp_dataset.py(13KB)
--------__init__.py(485B)
--------kitti_dataset.py(5KB)
--------diode_dataset.py(4KB)
--------flicker_dataset.py(2KB)
--------base_dataset.py(4KB)
--------diw_dataset.py(3KB)