深度学习--图像预处理

时间:2024-03-03 14:29:35

图片存储原理:

      主流颜色空间:1.RGB三通道彩色图:图片——>三维矩阵

  

 

                                  2.单通道灰度图:Gray=R*0.3+G*0.59+B*0.11

 

 

 图像增强

目标:

1.改善图像的视觉效果

2.转换为更适合于人或机器分析处理的形式

3.突出对人或机器分析有意义的信息

4.抑制无用信息,提高图像的使用价值;

具体方法:

包括图像锐化,平滑、去噪,灰度调整(对比度增强)

 

 

 点运算:

直方图:对图片数据、特征分布的一种统计(1.灰度、颜色 2.梯度\边缘、形状、纹理 3.局部特征点、视觉词汇)

 

 

 直方图均衡化(防止明暗差别过大):实质上是对图像进行非线性的拉伸。重新分配各个灰度单位中的像素点数量,使一定灰度范围内像素点数量的值大致相等

直方图均衡的经典算法对整幅图像的像素使用相同的变换,如果图像中包括明显亮的或者暗的区域,则经典算法作用有限。

自适应直方图均衡(AHE):通过对局部区域进行直方图均衡,来解决上述问题。移动模板在原始图片上按特定步长滑动;每次移动后,模板区域内做直防图均衡,映射后的结果赋值给模板区域内所有点,每个点会有多次赋值,最终的取值为这些赋值的均值。

但是AHE会过度放大图像中相对均匀区域的噪音,可采用限制对比度自适应直方图均(CLAHE)。与普通的自适应直方图均衡相比,CLAHE的不同地方在于直方图修剪过程(双线性插值),用修剪后的直方图均衡图像时,图像对比度会更自然。

 CLAHE算法步骤:
1.图像分块,以块为单位;
2.先计算直方图,然后修剪直方图,最后均衡;
3.遍历操作各个图像块,进行块间双线性插值;
4.与原图做图层滤色混合操作。 (可选)

 

 形态学运算

膨胀:图像中的高亮部分进行膨胀,类似于领域扩张
腐蚀:图像中的高亮部分被腐蚀,类似于领域被蚕食

 

 正向腐蚀(B沿着A的边走一遍,形成的内部图案),反向膨胀

 

开运算:先腐蚀再膨胀,可以去掉目标外的孤立点。
闭运算:先膨胀再腐蚀,可以去掉目标内的孔。

 

通常,当有噪声的图像用阈值二值化后,所得到的边界是很不平滑的,物体区域具有一些错判的孔洞,背景区域散布着一些小的噪声物体,连续的开和闭运算可以显著的改善这种情况。

 

 

空间预处理及其变换

滤波/卷积:在每个图片位置(x,y)上进行基于淋雨的函数计算。不同功能需要不同的函数(平滑/去噪,梯度/锐化等)

 

 

 图片中各点的数值和卷积核中的点对应相乘再相加得到结果

边界填充:使卷积后的尺度与前相同

 

 

 

 补零用的最多,但是补得0过多影响比较大。

 

高斯金字塔:

图像金字塔化:先进行图像平滑,再进行降采样,根据降采样频率,得到一系列尺寸逐渐减小的图像。

操作:N次(高斯卷积->2倍降采样)-->n层金字塔

目的:捕捉不同尺寸的物体

 

 

 拉普拉斯金字塔我感觉就是高斯金字塔的逆过程。

傅里叶变换:

一个信号可以有足够多个不同频率和幅值的正余弦波组成。

 

这我也讲不明白,看看吧。

 

 

学习地址:https://www.bilibili.com/video/BV1iJ411G741?p=2