用opencv检测人眼并定位瞳孔位置

时间:2024-02-24 10:12:57

  最近的研究要用到定位瞳孔的位置,所以上网搜了下相关的代码。总结如下:

        1) 定位瞳孔可以直接使用opencv中的自带的分类器(haarcascade_eye_tree_eyeglasses.xml)来实现,以前听师兄说用opencv自带的这个方法定位瞳孔不准,但我自己做了实验后发现在正面人脸的情况下定位还是很准确的,后面有图。分析了下原因,师兄是他之前实验时感觉不准有可能是他的Opencv版本还不是很高,我这里用的是opencv2.4.4,相信opencv也在它的后续版本中不断的优化它的Machine learning中相关库以提高准确率。

        当然,在复杂情况下的人眼精准定位本身就是一个热门的研究课题。所以如果是复杂情况下的精准定位,opencv可能就没那么给力了。

       2)用opencv中检测人脸、眼睛、嘴巴等都是用的CascadeClassifier分类器,具体使用时可以使用C的函数,也可以使用opencv中使用C++封装好的类。下面是它们检测目标时的函数形式(从opencv官网复制的)

C: CvSeq* cvHaarDetectObjects(const CvArr* image, CvHaarClassifierCascade* cascade,CvMemStorage* storage, double scale_factor=1.1, int min_neighbors=3, int flags=0, CvSize min_size=cvSize(0,0), CvSize max_size=cvSize(0,0) )

C++: void CascadeClassifier::detectMultiScale(const Mat& image, vector<Rect>& objects, double scaleFactor=1.1, int minNeighbors=3, int flags=0, Size minSize=Size(), Size maxSize=Size())

    这两者最大的区别在于,用C封装的函数要自己手动分配内存,而用C++的形式则不用自己去分配内存,这就是很多同学在网上找到的代码有些要分配内存,有些又不用分配内存的原因。显然C++的形式更简洁,所以我下面的代码也是用的C++的函数。

        直接上代码,注意下面的haarcascade_eye_tree_eyeglasses.xml文件在opencv安装目录下的data文件夹中。

        完整的代码在http://download.csdn.net/detail/computerme/7680383

 

[cpp] view plaincopy在CODE上查看代码片派生到我的代码片
 
 
  1. <span style="font-size:14px;">#include "highgui.h"  
  2. #include "cv.h"  
  3. #include <iostream>  
  4. #include <stdio.h>  
  5.   
  6. using namespace std;  
  7. using namespace cv;  
  8.   
  9.   
  10. void DetectAndDraw(IplImage* img, CascadeClassifier& cascade);  
  11.   
  12. //String cascadeName = "haarcascade_frontalface_alt.xml";  
  13. String cascadeName = "haarcascade_eye_tree_eyeglasses.xml";//nestedCascadeName  
  14.   
  15. int main( )  
  16. {  
  17.     CascadeClassifier cascade;  
  18.     cascade.load( cascadeName );  
  19.     cvNamedWindow( "result", 1 );  
  20.   
  21.     IplImage* iplImg = cvLoadImage("1.jpg");  
  22.   
  23.     DetectAndDraw( iplImg, cascade );  
  24.   
  25.     cvWaitKey(0);  
  26.   
  27.     cvDestroyWindow("result");  
  28.   
  29.     return 0;  
  30. }  
  31.   
  32.   
  33. void DetectAndDraw(IplImage* img, CascadeClassifier& cascade)  
  34. {  
  35.     int i = 0;  
  36.     double t = 0;  
  37.     vector<Rect> faces;  
  38.     const static Scalar colors[] =  { CV_RGB(0,0,255),  
  39.         CV_RGB(0,128,255),  
  40.         CV_RGB(0,255,255),  
  41.         CV_RGB(0,255,0),  
  42.         CV_RGB(255,128,0),  
  43.         CV_RGB(255,255,0),  
  44.         CV_RGB(255,0,0),  
  45.         CV_RGB(255,0,255)} ;  
  46.     IplImage* gray = cvCreateImage(cvGetSize(img),8,1);  
  47.     cvCvtColor( img, gray, CV_BGR2GRAY );  
  48.     cvEqualizeHist( gray, gray );  
  49.   
  50.     t = (double)cvGetTickCount();  
  51.     cascade.detectMultiScale( gray , faces,  
  52.         1.1, 2, 0  
  53.         //|CV_HAAR_FIND_BIGGEST_OBJECT  
  54.         //|CV_HAAR_DO_ROUGH_SEARCH  
  55.         |CV_HAAR_SCALE_IMAGE  
  56.         ,  
  57.         Size(30, 30) );  
  58.     t = (double)cvGetTickCount() - t;  
  59.     printf( "detection time = %g ms\n", t/((double)cvGetTickFrequency()*1000.) );  
  60.   
  61.     for( vector<Rect>::const_iterator r = faces.begin(); r != faces.end(); r++, i++ )  
  62.     {  
  63.         Point center;  
  64.         Scalar color = colors[i%8];  
  65.         int radius;  
  66.         //center可以作为瞳孔的坐标  
  67.         center.x = cvRound(r->x + r->width*0.5);  
  68.         center.y = cvRound(r->y + r->height*0.5);  
  69.         //radius = (int)(cvRound(r->width + r->height)*0.25);  
  70.         radius =2;  
  71.         cvCircle( img, center, radius, color, 3, 8, 0 );  
  72.         cvShowImage( "result", img );  
  73.     }  
  74.   
  75.     cvShowImage( "result", img );  
  76. }</span>  


运行结果:

 

 

网址:http://blog.csdn.net/computerme/article/details/38142125