山东大学数字图像处理实验(二)

时间:2022-09-26 21:55:15

前言

  • 本次为《对比度和亮度调整》与《背景相减两个实验》
  • 源码地址在文末

对比度和亮度调整实验

实验过程中遇到和解决的问题

  • 问题一

    • 问题:只知道使用 sigmoid 函数,不知道使用一个什么样的 sigmoid 函数比较合适
    • 解决:上网搜寻,了解到对比度和亮度的一般调节公式为:在进行对比度调整时,会在像素值前面增加一个与其相乘的系数。在亮度调整时,会使用一个变量与像素值相加减
  • 问题二:

    • 问题:只考虑了 sigmoid 函数的变化趋势,而没有考虑到具体的值,函数值只在[-5,5]内有明显变化

    • 解决:在像素变换公式上进行调整

      • 原始公式为

        int t = source_image.at<Vec3b>(y, x)[c];
        transformed_image.at<Vec3b>(y, x)[c] = saturate_cast<uchar>(t * ((contrast_value*0.1 / (1.00 + exp(-t))) + 1));
        
      • 调整后公式为

        double t = ((source_image.at<Vec3b>(y, x)[c] - 127) / 255.00) * contrast_value * 0.1;//[-10, 10]
        transformed_image.at<Vec3b>(y, x)[c] = saturate_cast<uchar>(source_image.at<Vec3b>(y, x)[c] * ((1.00 / (1.00 + exp(-t))) + 0.3) + bright_value - 100);
        
      • -127是为了让结果有正有负,这样像素小的会导致 1 + e − t 1+e^{-t} 1+et 更大,对比度调整之后,像素值更小。反之,像素值大的调整的程度不像像素值小的那样剧烈,因此会导致他们之间的像素差更大,因此对比度得到调整

      • /255 是为了限制 t t t 的范围,使其尽量在幂函数变化范围较明显的区域变动

      • contrast_value 就是滑动条需要改变的值,用于进行对比度调整

      • 1 1 + e − t + 0.3 \frac{1}{1+e^{-t}} + 0.3 1+et1+0.3 ,加了一个系数是因为,如果不加系数的话,只调整对比度会导致变换后的像素值永远小于原像素值,这不是我们想要的。另一个原因是,这个可以平衡一下 t t t 的作用,不让 t t t 的影响程度这么大。(加的数值大小可以自行控制)

      • bright_value 比较好理解,就是单纯对像素值进行调整,用于亮度调整

  • 问题三:利用调整公式,难以得到原图。个人认为是因为用了非线性变换,目前没有解决

结果分析与体会

调整效果比较明显,且都比较正常,实验结果达到预期效果

  • 使用sigmoid函数难以得到原图

  • 对比度超过一定范围就会丢失图像的真实感
    山东大学数字图像处理实验(二)

山东大学数字图像处理实验(二)

背景相减实验

实验过程中遇到和解决的问题

  • 问题一

    • 问题:两张图像对应位置像素相减得到图片效果很差

山东大学数字图像处理实验(二)
误检:

  • 当图像中的像素值和背景图中对应位置像素值相差不大时,难以进行分辨,相减后前景图该位置基本为黑色,不符合预期要求。

  • 以上述图片为例,当人身上的像素值小于背景像素值时,人的像素值减去背景像素值通过防止溢出处理后,结果图像对应位置像素值为0,不符合预期要求。

    • 解决:寻找更好的解决方案,使用中值滤波去除噪声点。通过将两张图片每个像素点的三个通道的差值平方求和得到sum,然后再对sum开方。手动设定一个阈值,当sum大于这个阈值时,该像素点的三通道都设为255(白色),否则设为0(黑色)。结果发现,阈值去75—100效果最好 , 最终选定阈值为90

结果分析与体会

可以看到,基本将人物这一前景提取出来,但仍有噪声存在

  • 背景相减实验可以多看一些降噪的算法,因为不太容易确定相减的标准

  • 背景相减实验阈值选为90时得到的结果。轮廓清晰,达到预期效果

山东大学数字图像处理实验(二)

遇到的知识点

at函数

  • 对于单通道图像"picture1",picture1.at(i,j)就表示在第i行第j列的像素值。

  • 对于多通道图像如RGB图像"picture2",可以用picture2.at(i,j)[c]来表示某个通道中在(i,j)位置的像素值。

常见类型Vec3b

Vec3b可以看作是vector<uchar, 3> , 简单而言就是一个uchar类型的,长度为3的vector向量。

由于在OpenCV中,使用imread读取到的Mat图像数据,都是用uchar类型的数据存储,对于RGB三通道的图像,每个点的数据都是一个Vec3b类型的数据。使用at定位方法如下:
 
img.at<Vec3b>(row, col)[0] = 255;  // 这是指修改B通道数据
img.at<Vec3b>(row, col)[1] = 255;  // 这是指修改G通道数据
img.at<Vec3b>(row, col)[2] = 255;  // 这是指修改R通道数据

point

srcImage.at<uchar>(j, i) //表示的是  j 行 i 列 的这个像素
srcImage.at<uchar>(Point(j, i)) //表示的是 坐标(j,i)的像素

saturate_cast

  • saturate_cast主要是为了防止颜色溢出操作
  • 在图像处理方面,无论是加是减,乘除,都会超出一个像素灰度值的范围(0~255),saturate_cast函数的作用即是:当运算完之后,结果为负,则转为0,结果超出255,则为255。

Mat::zeros

  • 创建一张图,每个像素的每个通道都为0
Mat m = Mat::zeros(2, 2, CV_8UC3);//直接指明size和类型

transformed_image = Mat::zeros(source_image.size(), source_image.type());//创建一个和source_image一样类型的图

createTrackbar

创建滑动条

  • 回调函数与createTrackbar配合使用
CV_EXPORTS int createTrackbar(const String& trackbarname,
                              const String& winname,
                              int* value, 
                              int count,                                        
                              TrackbarCallback onChange = 0,
                              void* userdata = 0);    
  • 滑动条名字
  • 滑动条所在窗口名字
  • 用来设置滑块的初始值,同时记录滑块以后的位置(用户改变了滑块的位置,因此value值会改变)
  • 轨迹的最大值,滑块可以滑动的范围是[0 , count]
  • 回调函数
  • 默认0,用户传给回调函数的数据,如果第三个值为全局变量,忽略这个值
namedWindow("Transformed Window", WINDOW_AUTOSIZE);
createTrackbar("contrast", "Transformed Window", &contrast_value, 200, ContrastAndBright , 0);
createTrackbar("bright", "Transformed Window", &bright_value, 200, ContrastAndBright , 0);

static void ContrastAndBright(int pos , void* userdata) {
    //value传值给pos , createTrackbar的第六个参数传递给userdata
    for (int y = 0; y < source_image.rows; y++)
        for (int x = 0; x < source_image.cols; x++)
            for (int c = 0; c < 3; c++){
                double t = ((source_image.at<Vec3b>(y, x)[c] - 127) / 225.00) * contrast_value * 0.1;
                transformed_image.at<Vec3b>(y, x)[c] = saturate_cast<uchar>(source_image.at<Vec3b>(y, x)[c] * ((1.00 / (1.00 + exp(-t))) + 0.3) + bright_value - 100);
            }
    imshow("Display Window", source_image);
    imshow("Transformed Window", transformed_image);
}

源码地址:Computer-Vision/实验一/源码 at main · SDU-NSY/Computer-Vision (github.com)