deep-image-retrieval:深度视觉表示的端到端学习,用于图像检索

时间:2024-06-15 16:19:41
【文件属性】:

文件名称:deep-image-retrieval:深度视觉表示的端到端学习,用于图像检索

文件大小:16.41MB

文件格式:ZIP

更新时间:2024-06-15 16:19:41

deep-neural-networks pytorch image-retrieval Python

深度图像检索 目录 牛津数据集 巴黎数据集 表现 烧瓶的推论应用 Google云端硬碟连结 如何重现代码? Pytorch源代码(包含在/ src中) Flask应用程序(包含在/ flask_app中) 介绍 该项目的目标是深度图像检索,即学习从图像到紧凑的潜在空间的嵌入(或映射),其中两个学习的嵌入之间的余弦相似度对应于图像检索任务的排名度量。 该存储库包含一个用于深度图像检索的简单入门实现。 此处未实现查询扩展或关注之类的高级功能。 数据 我们为此项目使用了由牛津视觉几何学集团(Oxford Visual Geometry Group)发布的两个流行的图像检索数据集, 牛津建筑数据集 巴黎建筑物数据集 这两个数据集都包含通过搜索特定地标从Flickr收集的图像。 对该集合进行了手动注释,以针对每个数据集的所有11个不同地标生成全面的地面真相,每个地标由5个查询表示。 这给出


【文件预览】:
deep-image-retrieval-master
----.gitignore(1KB)
----README.md(14KB)
----LICENSE(1KB)
----readme_pics()
--------triplet_learning.png(5KB)
--------performance.JPG(44KB)
--------neg_ssim_ex1.jpg(3.21MB)
--------all_souls_000051.jpg(454KB)
--------neg_ex1.jpg(4.11MB)
--------triplet_network.png(262KB)
--------paris_loss.png(24KB)
--------triplet_loss.png(13KB)
--------flask2.png(1.7MB)
--------demo.gif(5.14MB)
--------flask1.png(1.45MB)
--------oxford_loss.png(28KB)
----src()
--------test.py(1KB)
--------dataset.py(12KB)
--------train.py(6KB)
--------infer_on_single_image.py(5KB)
--------inference.py(1KB)
--------utils.py(8KB)
--------main.py(6KB)
--------create_db.py(4KB)
--------model.py(3KB)
----requirements.txt(685B)
----flask_app()
--------static()
--------dataset.py(12KB)
--------.gitattributes(66B)
--------infer_on_single_image.py(11KB)
--------inference.py(1KB)
--------deploy.py(3KB)
--------utils.py(9KB)
--------model.py(3KB)
--------requirements.txt(629B)
--------templates()

网友评论