图片存储原理:
主流颜色空间:1.RGB三通道彩色图:图片——>三维矩阵
2.单通道灰度图:Gray=R*0.3+G*0.59+B*0.11
图像增强
目标:
1.改善图像的视觉效果
2.转换为更适合于人或机器分析处理的形式
3.突出对人或机器分析有意义的信息
4.抑制无用信息,提高图像的使用价值;
具体方法:
包括图像锐化,平滑、去噪,灰度调整(对比度增强)
点运算:
直方图:对图片数据、特征分布的一种统计(1.灰度、颜色 2.梯度\边缘、形状、纹理 3.局部特征点、视觉词汇)
直方图均衡化(防止明暗差别过大):实质上是对图像进行非线性的拉伸。重新分配各个灰度单位中的像素点数量,使一定灰度范围内像素点数量的值大致相等
直方图均衡的经典算法对整幅图像的像素使用相同的变换,如果图像中包括明显亮的或者暗的区域,则经典算法作用有限。
自适应直方图均衡(AHE):通过对局部区域进行直方图均衡,来解决上述问题。移动模板在原始图片上按特定步长滑动;每次移动后,模板区域内做直防图均衡,映射后的结果赋值给模板区域内所有点,每个点会有多次赋值,最终的取值为这些赋值的均值。
但是AHE会过度放大图像中相对均匀区域的噪音,可采用限制对比度自适应直方图均(CLAHE)。与普通的自适应直方图均衡相比,CLAHE的不同地方在于直方图修剪过程(双线性插值),用修剪后的直方图均衡图像时,图像对比度会更自然。
1.图像分块,以块为单位;
2.先计算直方图,然后修剪直方图,最后均衡;
3.遍历操作各个图像块,进行块间双线性插值;
形态学运算
膨胀:图像中的高亮部分进行膨胀,类似于领域扩张
正向腐蚀(B沿着A的边走一遍,形成的内部图案),反向膨胀
开运算:先腐蚀再膨胀,可以去掉目标外的孤立点。
闭运算:先膨胀再腐蚀,可以去掉目标内的孔。
通常,当有噪声的图像用阈值二值化后,所得到的边界是很不平滑的,物体区域具有一些错判的孔洞,背景区域散布着一些小的噪声物体,连续的开和闭运算可以显著的改善这种情况。
空间预处理及其变换
滤波/卷积:在每个图片位置(x,y)上进行基于淋雨的函数计算。不同功能需要不同的函数(平滑/去噪,梯度/锐化等)
图片中各点的数值和卷积核中的点对应相乘再相加得到结果
边界填充:使卷积后的尺度与前相同
补零用的最多,但是补得0过多影响比较大。
高斯金字塔:
图像金字塔化:先进行图像平滑,再进行降采样,根据降采样频率,得到一系列尺寸逐渐减小的图像。
操作:N次(高斯卷积->2倍降采样)-->n层金字塔
目的:捕捉不同尺寸的物体
拉普拉斯金字塔我感觉就是高斯金字塔的逆过程。
傅里叶变换:
一个信号可以有足够多个不同频率和幅值的正余弦波组成。
这我也讲不明白,看看吧。
学习地址:https://www.bilibili.com/video/BV1iJ411G741?p=2