OpenCV(三) 之 基本数据结构 CvMat和 IplImage
OpenCv中基本的数据类型
类型 | 参数 | 表示 |
---|---|---|
CvPoint | int x,y | 像素点 |
CvPoint2D32f | float x,y | 平面点 |
CvPoint3D32f | float x,y,z | 空间点 |
CvSize | int width,height | 图像大小 |
CvSize2D32f | float x, y | 区域大小 |
CvSize3D32f | float x,y,z | 立方体大小 |
CvRect | int x,y,width,height | 矩形区域 |
CvScalar | double val[4] | RGBA 值 |
类型的构造函数仅是类型名首字母小写,比如cvPoint(int x,int y),除了CvScalar
CvScalar类型是可以用来存放4个double类型的数组,最多四个不一定要四个
- typedef struct CvScalar
- {
- double val[4];
- };
其赋值函数有四种
- 1. CvScalar cvScalar(double v0,double v1,double v2, double v3);
- 2. CvScalar cvRealScalar(double v0);
- //第一个数值赋值,剩余三个为0
- 3. CvScalar cvScalarAll(double v);
- //所有的四个值都相同
- 4. CV_RGB
- #define CV_RGB(r,g,b) cvScalar(b,r,g,0);
CvMat类型
- typedef struct CvMat {
- int type;
- int step;
- int* refcount; // for internal use only
- union {
- uchar* ptr;
- short* s;
- int* i;
- float* fl;
- double* db;
- } data;
- union {
- int rows;
- int height;
- };
- union {
- int cols;
- int width;
- };
- } CvMat;
其构造函数
- CvMat* cvCreateMat(int rows,int cols,int type);
- CvMat* cvCreateMatHeader(int rows,int cols,int type);
- CvMat* cvInitMatHeader(CvMat *mat,int rows,int cols,int type, void* data=NULL, int step = CV_AUTOSTEP)
- CvMat* cvCloneMat(CvMat*)
- //内存释放
- void cvReleaseMat(CvMat** mat)
使用数组创建CvMat
- float vals[4]=[1,2,3,4];
- CvMat* mat;
- cvInitMatHeader(mat,2,2,CV_32FC1,vals);
CvMat属性值的获取
- cvGetElemType(const CvArr* arr);//返回数据类型
- cvGetDims(const CvArr* arr,int* sizes=NULL);//返回CvMat的维数,相当于张量的阶数, int* 可以用来存储每一维对应的长度
- cvGetDimSize(const CvArr* arr,int index);//返回第index维度上的长度
CvMat数据值的读取
- float sum( const CvMat* mat )
- {
- float s = 0.0f;
- for(int row=0; row<mat->rows; row++ )
- {
- const float* ptr = (const float*)(mat->data.ptr + row * mat->step);
- for( col=0; col<mat->cols; col++ )
- {
- s += *ptr++;
- }
- }
- return( s );
- }
这里要注意的是
要强制指定数据类型,因为CvMat定义中数据类型是union。
使用step参数是每一行所占的字节数,并不等于cols*sizeof(bytes),因为含有优化的地址对齐问题。
CvMat矩阵数据存储顺序是先行再列,3D数据存储顺序是每个位置的channels,然后按行、列排列。
下图时一组空间点存到不同的CvMat的存储结果
IplImage
- typedef struct _IplImage{
- int nSize;
- int ID;
- int nChannels; //**type
- int alphaChannel;
- int depth; //**type
- int dataOrder; //数组存储结构,是按照像素存IPL_DATA_ORDER_PIXEL,还是先按照通道存IPL_DATA_ORDER_PLANE
- int origin; //图像坐标原点位于左上角 IPL_ORIGIN_TL,还是左下角IPL_ORIGIN_BL
- int align;
- int width; //**columns
- int height; //**rows
- char colorModel[4];
- char channelSeq[4];
- struct _IplROI* roi; //region of interest
- struct _IplImage* maskROI;
- void* imageId;
- struct _IplTileInfo* tileInfo;
- int imageSize;
- char* imageData; //** data
- int widthStep; //** step
- int BorderMode[4];
- int BorderConst[4];
- char* imageDataOrigin;
- }
其中注释**部分对应着CvMat的成员变量,CvMat的type成员被拆分成了两个属性:depth, nChannels表示像素值深度和图像的通道数
depth的取值有
- IPL_DEPTH_8U; IPL_DEPTH_8S; IPL_DEPTH_16S; IPL_DEPTH_32S; IPL_DEPTH_32F; IPL_DEPTH_64F;
看字面就知道什么意思了。
IplROI包含的属性:
- int xOffset, yOffset; //x,y 方向的偏置
- int height, width; //感兴趣区域的大小
- int COI; //Channel of Interest,感兴趣的通道
一旦ROI设置了,那么对图像的操作将尽在ROI内操作。
IplImage数据的访问示例
对于HSV图像,希望将S,V通道值设置为255:
- void saturate_sv(IplImage* img)
- {
- for(int y=0;y<img->height;y++)
- {
- uchar* ptr=(uchar*)(img->imageData+y*img->widthStep);
- for(int x=0;x<img->width;i++)
- {
- ptr[3*x+1]=255;
- ptr[3*x+2]=255;
- }
- }
- }
这里奇怪为什么默认img->dataOrder=IPL_DATA_ORDER_PIXEL。这是因为
We say that dataOrder may be either IPL_DATA_ORDER_PIXEL of IPL_DATA_ORDER_PLANE, but in fact only IPL_DATA_ORDER_PIXEL is supported by OpenCV. Both values are generally supported by IPL/IPP, but OpenCV always uses interleaved images.
Note: 比较CvMat和IplImage数据区的操作,发现IplImage->imageData并没有进行类型转换,全部都是byte字节,而CvMat则需要转换成所存储数据的类型,在指针运算时需要特别注意,尤其是IplImage和CvMat进行计算时。
ROI的使用:
- void cvSetImageROI(IplImage* image, CvRect rect); //设置rect区域为感兴趣区域
- void cvResetImageROI(IplImage* image); //取消图像的感兴趣区域
- #include "highgui.h"
- #include "cv.h"
- int main(int argc, char** argv)
- {
- // 图像路径、ROI的x,y偏移量, 长和宽、像素值增加量
- IplImage* src;
- if (argc == 7 && ((src = cvLoadImage(argv[1])) != 0))
- {
- int xOffset = atoi(argv[2]); //x偏移
- int yOffset = atoi(argv[3]); //y偏移
- int width = atoi(argv[4]); //ROI宽
- int height = atoi(argv[5]); //ROI高
- int add = atoi(argv[6]); //每个像素值增加量
- cvSetImageROI(src, cvRect(xOffset, yOffset, width, height));
- cvAddS(src, cvScalarAll(add), src);
- cvResetImageROI(src);
- cvNamedWindow("src");
- cvShowImage("src", src);
- cvWaitKey(0);
- cvReleaseImage(&src);
- cvDestroyWindow("src");
- }
- }
上述过程还存在另一种直接地址操作的方法
- #include "highgui.h"
- #include "cv.h"
- int main(int argc, char** argv)
- {
- // 图像路径、ROI的x,y偏移量, 长和宽、像素值增加量
- IplImage* src;
- if (argc == 7 && ((src = cvLoadImage(argv[1])) != 0))
- {
- int xOffset = atoi(argv[2]); //x偏移
- int yOffset = atoi(argv[3]); //y偏移
- int width = atoi(argv[4]); //ROI宽
- int height = atoi(argv[5]); //ROI高
- int add = atoi(argv[6]); //每个像素值增加量
- IplImage * sub_img = cvCreateImageHeader(cvSize(width, height), src->depth, src->nChannels);
- sub_img->widthStep = src->widthStep;
- sub_img->imageData = src->imageData + yOffset*src->widthStep + xOffset*src->nChannels;
- cvAddS(sub_img, cvScalarAll(add), sub_img);
- cvReleaseImageHeader(&sub_img);
- cvResetImageROI(src);
- cvNamedWindow("src");
- cvShowImage("src", src);
- cvWaitKey(0);
- cvReleaseImage(&src);
- cvDestroyWindow("src");
- }
- }
这里很容易理解,就是将ROI截取出来作为一个新的图像,需要注意的时sub_img并没有新分配地址,数据区指向的仍然是src的数据区,此时图像sub_img的数据区并不是连续的,所以将src->widthStep赋值给sub_img-》widthStep保证读取正确的地址数据。