RandomResizedCrop

时间:2025-02-19 20:47:45

source code

RandomResizedCrop,默认scale=(0.08, 1.0)
0.08意味着在100×100的图像中,最小的crop_img约为28×28

get_params函数中,输入参数imgPIL Image对应(w, h)

计算img的面积

area = [0] * [1]

[0.08 * area, 1.0 * area]采样crop_img的面积

target_area = (*scale) * area

[3/4, 4/3]采样crop_img的宽高比

aspect_ratio = (*ratio)

由此可以建立关于wh的方程组

w * h = target_area
w / h = aspect_ratio

解得

w = int(round((target_area * aspect_ratio)))
h = int(round((target_area / aspect_ratio)))

以50%的概率交换wh,因为宽高比的定义为
w / h = aspect_ratioh / w = aspect_ratio均可

if () < 0.5:
	w, h = h, w

检查crop_imgwh是否超出img的范围,如果未超出范围,则获得一组(i, j, h, w)

if w <= [0] and h <= [1]:
	i = (0, [1] - h)
	j = (0, [0] - w)
	return i, j, h, w

如果超出范围,则重新做一遍,这一系列步骤总共尝试10次,对应for attempt in range(10):

如果10次尝试都失败了,则计算img的短边,然后center crop一个正方形

w = min([0], [1])
i = ([1] - w) // 2
j = ([0] - w) // 2
return i, j, w, w

最后根据(i, h, h, w)裁剪出crop_img,然后resize为指定大小