https://blog.****.net/qq_23589775/article/details/81143584
Tensorflow中,在训练图片数据之前,需要先对图片进行预处理,读图和裁剪是最基本的两步。常见的的读图何裁剪分别有两种方式,这里小编将和大家分享下这几种方式的实现以及他们之间的区别。
一、常见的两种读图方式 io.imread() 和 cv2.imread()
1.io.imread 读出的图片格式是uint8,value是numpy array 类型。对于RGB 图片,图像数据是以RGB 的格式进行存储的。
2.cv2.imread读出的图片格式是uint8 ,value也是numpy array 类型。唯一的区别是,图像数据格式是以BGR的格式进行存储的。需要将存储类型改成RGB 的形式才能正常显示原图的颜色。特别是制作tfrecord 时,需要将图片通道改成RGB,具体代码如下。
-
import cv2
-
import matplotlib.pyplot as plt
-
from skimage import transform
-
import numpy as np
-
import skimage.io as io
-
train_dir = 'E:/TensorFlow/Project_TF/flower_tfrecord/data/test/roses/timg.jpg'
-
'''以cv2方式读取图片'''
-
image=cv2.imread(train_dir)
-
b,g,r = cv2.split(image) #将图像通道分离开
-
rgb_image = cv2.merge([r,g,b]) #以RGB的形式重新组合
-
#image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) 也可以使用这个函数直接转换成RGB 形式
-
plt.imshow(rgb_image)
-
'''以io.imread方式读取图片'''
-
#image = io.imread(train_dir) #读图并显示
-
#plt.imshow(image)
- 1
二、常见的两种图片裁剪方式 cv2.resize() 和 transform.resize()
1.通过cv2.resize()裁剪后的图片还是以 numpy array 的方式保存的, 数值的取值范围是(0~255)
2.通过transform.resize()裁剪后的图片是以 float64的格式存储的,数值的取值范围是(0~1)。通常在制作tfrecord 数据集的过程中,我们需要将其转换成numpy array的形式,具体代码如下
-
'''以io.imread方式读取图片并使用transform形式裁剪图片'''
-
image = io.imread(train_dir) #读图并显示
-
plt.imshow(image)
-
image =transform.resize(image, (208, 208))
-
img = image * 255 #将图片的取值范围改成(0~255)
-
img = img.astype(np.uint8)
-
plt.imshow(img)
- 1
Tensorflow中,在训练图片数据之前,需要先对图片进行预处理,读图和裁剪是最基本的两步。常见的的读图何裁剪分别有两种方式,这里小编将和大家分享下这几种方式的实现以及他们之间的区别。
一、常见的两种读图方式 io.imread() 和 cv2.imread()
1.io.imread 读出的图片格式是uint8,value是numpy array 类型。对于RGB 图片,图像数据是以RGB 的格式进行存储的。
2.cv2.imread读出的图片格式是uint8 ,value也是numpy array 类型。唯一的区别是,图像数据格式是以BGR的格式进行存储的。需要将存储类型改成RGB 的形式才能正常显示原图的颜色。特别是制作tfrecord 时,需要将图片通道改成RGB,具体代码如下。
-
import cv2
-
import matplotlib.pyplot as plt
-
from skimage import transform
-
import numpy as np
-
import skimage.io as io
-
train_dir = 'E:/TensorFlow/Project_TF/flower_tfrecord/data/test/roses/timg.jpg'
-
'''以cv2方式读取图片'''
-
image=cv2.imread(train_dir)
-
b,g,r = cv2.split(image) #将图像通道分离开
-
rgb_image = cv2.merge([r,g,b]) #以RGB的形式重新组合
-
#image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) 也可以使用这个函数直接转换成RGB 形式
-
plt.imshow(rgb_image)
-
'''以io.imread方式读取图片'''
-
#image = io.imread(train_dir) #读图并显示
-
#plt.imshow(image)
- 1
二、常见的两种图片裁剪方式 cv2.resize() 和 transform.resize()
1.通过cv2.resize()裁剪后的图片还是以 numpy array 的方式保存的, 数值的取值范围是(0~255)
2.通过transform.resize()裁剪后的图片是以 float64的格式存储的,数值的取值范围是(0~1)。通常在制作tfrecord 数据集的过程中,我们需要将其转换成numpy array的形式,具体代码如下
-
'''以io.imread方式读取图片并使用transform形式裁剪图片'''
-
image = io.imread(train_dir) #读图并显示
-
plt.imshow(image)
-
image =transform.resize(image, (208, 208))
-
img = image * 255 #将图片的取值范围改成(0~255)
-
img = img.astype(np.uint8)
-
plt.imshow(img)
- 1
https://blog.****.net/qq_24193303/article/details/79970819
--------------------- 本文来自 ChuShengWHU 的**** 博客 ,全文地址请点击:https://blog.****.net/qq_23589775/article/details/81143584?utm_source=copy