文件名称:深度学习数据集图片分类
文件大小:6KB
文件格式:PY
更新时间:2022-08-30 16:50:45
python 深度学习 数据集分类
深度学习中,对不同类的数据集图片进行分类,使得训练集、测试集、验证集中含有的图片类别不冲突。例如我手头有一个医学图像处理的数据集,我要检测图片中的病变类别,分清他是肿瘤、创伤还是其它问题,因为每一类图片都对应着多个病人,但在实际训练过程中,同一个病人的病变图片差不多,如果分属于训练集、验证集、测试集,那么检测精度一定会有是会有所下降,所以需要先进行一次分类。这个程序就是起到这样一个作用。classify.py #读取图片前六位 def sixTop(fileList): sixTopName = list() for name in fileList: sixTopName.append(name[0:6]) return sixTopName #判断前六位数字是否重复,输出次数 def imgRepeat(L): repeatList = [] setList = set(L) flag=True if len(L) != len(setList): flag=False