1 概述
在OpenCV中,HighGUI模块为高层GUI图形用户界面模块,包含媒体的输入输出、视频捕捉、图像和视频的编码解码、图形交互界面的接口等内容。本章旨在为大家展开讲解OpenCV中最常用到的一些交互操作,包括图像的载入、显示和输出,为程序添加滑动条,以及鼠标操作等常用内容。
2 图像的载入、显示和输出到文件
学习过以往版本OpenCV的读者应该都清楚,对于OpenCV1.0时代的基于C语言接口而建的图像存储格式 Ipllmage*, 如果在退出前忘记 release 掉的话,会造成内存泄露,而且用起来十分繁琐。我们在debug程序的时候,往往很大一部分时间会去纠结手动释放内存相关的问题。虽然对于小型的程序来说,手动管理内存不是什么难题,但一旦开发的项目日益庞大,代码量达到一定的规模,我们便会开始越来越多地纠缠于内存管理的问题,而不能把全部精力用于解决核心开发目标。因为不合适的图像存储数据结构而疲于维护日益庞大的项目,就有些舍本逐末的感觉了。
自踏入2.0版本的时代以来,OpenCV采用了Mat类作为数据结构进行图像存取。这一改进使OpenCV变得和几乎零门槛入门的Matlab一样,很容易上手和用于实际开发。新版OpenCV中甚至有些函数名称都和Matlab中的一样,比如大家所熟知的imrhow等函数。这对于广大图像处理和计算机视觉领域的研究者们来说,的确是一件可喜可贺的事情。
3 OpenCV的命名空间
OpenCV中的C++类和函数都是定义在命名空间cv之内的,有两种方法可以访问:第一种,是在代码开头的适当位置加上using namespace cv;这句代码,规定程序位于此命名空间之内:另外一种,是在使用OpenCV的每一个类和函数时,都加入cv::命名空间。不过这种情况会很繁琐,每用一个OpenCV的类或者函数,都要多敲四下键盘写出cv::。所以,推荐大家在代码开头的适当位置,加上using namespace cv;这句。 比如在写简单的OpenCV程序的时候,以下三句可以作为标配:
4 Mat类简析
Mat 类是用于保存图像以及其他矩阵数据的数据结构,默认情况下其尺寸为0。我们也可以指定其初始尺寸,比如定义一个要写
Mat 类型作为OpenCV2为OpenCV2、OpenCV3新纪元的重要代表,它是对应于 OpenCV1.0 时代的Ipllmage,我们需要用到关于Mat的其实就简单的这样一句代码:
这表示从工程目录下把一幅名为dota的jpg类型的图像载入到Mat类型的srelmage变量中。对于这里的imread函数,用于将图片读入Mat类型中。
5 图像的载人imread函数
imread 函数,其用于读取文件中的图片到OpenCV中。可以在OpenCV官方文档中查到它的原型,如下。
第1个参数,filename,填我们需要载入的图片路径。在Windows操作系统下,OpenCV的imread函数支持如下类型的图像载入。
- Windows位图:.bmp,.dib
- JPEG 文件:.jpeg,.jpg,*.jpe
- JPEG 2000 文件:*.jp2
- PNG 图片:*.png
- 便携文件格式:.pbm,.pgm,*.ppm
- Sun rasters光栅文件:.sr,.ras
- TIFF文件:.tiff,.tif
(2)第二个参数,int类型的 个参数,int类型的flags,为载入标识,它指定一个加载图像的颜色类型。可以看到它自带默认值1,所以有时候这个参数在调用时可以忽略。 个参数在调用时可以忽略。在看了下面的讲解之后,我们就会发现,如果在调用时忽略这个参数,就表示载入三通道的彩色图像。这个参数可以在OpenCV中标识图像格式的枚举体中取值。通过转到定义,我们可以在们可以在higui_c.h中发现这个枚举的定义是这样的:
对常用标识符相应的解释:
- CV_LOAD_IMAGE_UNCHANGED等价取值为-1,这个标识在新版本 中已被废置,忽略。
- CV_LOAD_IMAGE_GRAYSCALE等价取值为0,如果取这个标识的话,始终将图像转换成灰度再返回。
- CV_LOAD_IMAGE_COLOR等价取值为1,如果取这个标识,总是转换图像到彩色再返回。
- CV_LOAD_IMAGE_ANYDEPTH等价取值为2,如果取这个标识,且载图像的深度为16位或者32位,就返回对应深度的图像,否则,就转换为8位图像再返回。
需要说明的是,如果输入有冲突的标入有冲突的标志,将采用较小的数字值。比如CV_LOAD_IMAGE COLOR|CV LOAD IMAGE ANYCOLOR 将载入三通道图。而如果想 要载入最真实无损的源图像,可实无损的源图像,可以选择CV_LOAD_IMAGE_ANYDEPTH CV_LOAD_IMAGE_ANYCOLOR。
因为flags是int型的变量,若我们不在这个枚举体中取固定的值,可以这样进行:
- flags>0返回一个3通道的彩色图像
- flags=0返回灰度图像
- flags<0返回包含Alpha通道的加载图像。
6 图像的显示imshow函数
imshow函数用于在指定的窗口中显示一幅图像,函数原型如下。
- 第一个参数:const string&类型的winname,填需要显示的窗口标识名称。
- 第二个参数:InputArray类型的mat,填需要显示的图像。
imshow函数用于在指定的窗口中显示图像。如果窗口是用 CV_WINDOW_AUTOSIZE(默认值)标志创建的,那么显示图像原始大小。否则,将图像进行缩放以适合窗口。而imshow函数缩放图像,取决于图像的深度,具体如下。
- 如果载入的图像是8位无符号类型(8—bit unsigned),就显示图像本来的样子。
- 如果图像是16位无符号类型(16-bit unsigned)或32位整型(32-bit integer),便用像素值除以256。也就是说,值的范围是[0,255x256]映射到[0, 256]。
- 如果图像是32位浮点型(32-bit floating-point),像素值便要乘以255。也就是说,该值的范围是[0,1]映射到[0,255]。
7 创建窗口namedWindow函数
namedWindow函数用于创建一个窗口。若是简单地进行图片显示,可以略去namedWindow函数的调用,即先调用imread读入图片,然后用imshow 直接指定 出窗口名进行显示即可。但需要在显示窗口之前就用到窗口名时,比如我们后面会马上讲到滑动条的使用,要指定滑动条依附到某个窗口上,就需要namedWindow函数先创建出窗口,显式地规定窗口名称了。
namedWindow的函数原型如下:
(1) 第一个参数,const string&型的name,填写被用作窗口的标识符的窗口名称。 (2) 第二个参数,int类型的flags,窗口的标识,可以填如下几种值。
- WINDOW_NORMAL,设置这个值,用户可以改变窗口的大小(没有限制)。OpenCV2中它还可以写为CV_WINDOW_NORMAL。
- WINDOW_AUTOSIZE,设置这个值,窗口大小会自动调整以适应所显示的图像,并且用户不能手动改变窗口大小。OpenCV2 中它还可以写为CV_WINDOW_AUTOSIZE。
- WINDOW_OPENGL,设置这个值,窗口创建的时候会支持 OpenGL。 OpenCV2中它还可以写为CV_WINDOW_OPENGL。
首先需要注意的是,namedWindow函数有默认值 WINDOW_AUTOSIZE,所 以,一般情况下,这个函数我们填一个变量就行了。namedWindow函数的作用是通过指定的名字,创建一个可以作为图像和进度条的容器窗口。如果具有相同名称的窗口已经存在,则函数不做任何事情。我们可以调用 destroyWindow或者 destroyAllWindows()函数来关闭窗口,并取消之前分配的与窗口相关的所有内存空间。但是事实上,对于代码量不大的简单程序来说,我们完全没有必要手动调用上述的destroyWindow()或者 destroyAllWindows()函数,因为在退出时,所有的资 源和应用程序的窗口会被操作系统自动关闭。
8 输出图像到文件imwrite函数
在OpenCV中,输出图像到文件一般采用imwrite函数,它的声明如下。
(1)第一个参数,const string&类型的filename,填需要写入的文件名。注意要带上后缀,如“123.jpg”。
(2)第二个参数,InputArray类型的img,一般填一个Mat类型的图像数据。
(3)第三个参数,const vector&类型的params,表示为特定格式保存的参数编码。它有默认值vector(),所以一般情况下不需要填写。而如果要填写的话,有下面这些需要了解的地方:
- 对于JPEG 格式的图片,这个参数表示从0到100的图片质量(CV_IMWRITE_JPEG_QUALITY),默认值是95。
- 对于PNG 格式的图片,这个参数表示压缩级别(CV_IMWRITE_PNGCOMPRESSION)从0到9。较高的值意味着更小的尺寸和更长的压缩时间,默认值是3。
- 对于PPM,PGM,或PBM格式的图片,这个参数表示一个二进制格式标志(CV_IMWRITE_PXM_BINARY),取值为0或1,默认值是1。
imwrite 函数用于将图像保存到指定的文件。图像格式是基于文件扩展名的,可保存的扩展名和imread中可以读取的图像扩展名一致。
9 效果例子
动漫图
原画图
Logo图
原画+Logo图