duplicate-images:使用pHash查找和删除重复图像的脚本

时间:2024-05-24 12:18:38
【文件属性】:

文件名称:duplicate-images:使用pHash查找和删除重复图像的脚本

文件大小:14.03MB

文件格式:ZIP

更新时间:2024-05-24 12:18:38

Python

重复图像查找器 该Python脚本使用来比较图像,以查找重复的图像。 pHash忽略图像大小和文件大小,而是根据图像像素创建哈希。 这使您可以查找已旋转,已更改元数据并进行了轻微编辑的重复图片。 该脚本对添加的图像进行哈希处理,将哈希存储到数据库(MongoDB)中。 为了找到重复的图像,将比较散列。 如果两个图像之间的哈希值相同,则将它们标记为重复。 提供了一个Web界面,可轻松删除重复的图像。 如果您感到幸运,可以选择自动删除重复的文件。 请注意,pHash并不完美。 我发现重复的图片有时具有不同的哈希值,而相似(但不相同)的图片则具有相同的哈希值。 此脚本是清理重复图片的照片库的一个很好的起点,但是请确保在删除图片之前先查看它们。 你被警告了! 对于因该脚本而丢失的任何家庭回忆,我不承担任何责任。 该脚本仅通过Python 3进行了测试,仍然有些粗糙。 使用风险自负。 要求


【文件预览】:
duplicate-images-master
----duplicate_finder.py(10KB)
----requirements.txt(195B)
----.travis.yml(280B)
----requirements-test.txt(63B)
----README.md(6KB)
----template()
--------index.html(4KB)
----tests()
--------test.py(6KB)
--------images()
--------__init__.py(0B)
----.gitignore(63B)
----CHANGELOG.md(201B)

网友评论