一、实验目的:我这里完成的是,将8张人脸图片(4组,每组两张)存入库中,选取1张图片,程序识别出与其匹配的另一张。
这里介绍分三个步骤完成该工作,①程序读取摄像头、拍照
②程序从电脑文档中读取图片
③检测人脸,并用红框框出人脸
④使用感知哈希算法匹配最相似的图片
二、实验环境: Win 7(x64)、visual studio 2010、openCV-2.4.3
使用语言:C++
三、实验准备:①安装好vs2010,本文不予介绍。
②配置opencv :
1'进入官网下载http://opencv.org/ (OpenCv 2.4x是支持Vs2010的,建议根据自己的Vs版本安装相应的OpenCv的版本)解压后,目录如下:
2'打开vs2010,创建项目,这里以我的工程名test为例。右击项目->属性->vc++目录->包含目录, 添加三个路径:(在解压后opencv下的build目录)
E:\新建文件夹\opencv\build\include
E:\新建文件夹\opencv\build\include\opencv
E:\新建文件夹\opencv\build\include\opencv2
然后点击库目录,添加路径:E:\新建文件夹\opencv\build\x86\vc10\lib
配置好了后,第二步,点击链接器->输入->附加依赖项,编辑添加,把E:\新建文件夹\opencv\build\x86\vc10\bin里面左右的文件名称全导入进去,导入带d的文件,比如有opencv_calib3d243.dll与opencv_calib3d243d.dll文件,只需添加后者带d的即可。
至此,openCV配置已经全部完成。接下来编写代码。
四、编写代码
①为了收集图片库,我编写了直接拍照的功能,按下p进行拍照,并自动命名排序存到文件中。
#include <iostream>
#include <opencv2/core/core.hpp>
#include <opencv2/highgui/highgui.hpp>
using namespace cv;
int main( int argc, char** argv )
{
int i=1;//照片名从1开始命名
while(1)
{
CvCapture *pCapture=cvCreateCameraCapture(-1);//打开摄像头
Mat image=cvQueryFrame(pCapture); //将摄像头拍的以图片形式展现
cvNamedWindow("frame",1); //命名一个窗口
imshow("frame",image); //在窗口显示图片
string filename=format("C:\\images\\%d.jpg",i);
char key=waitKey(100);
switch(key)
{
case'p':
i++; //键盘上每按一次p,就拍一张照
imwrite(filename,image); //写入图片
imshow("photo",image); //展示照片
waitKey(500);
destroyWindow("photo");
break;
default:break;
}
}
}
实验效果:
②读取图片,显示在屏幕上
Mat image=imread("C:\\images\\2.jpg",-1); //使用Mat创建一个对象,-1为打开类型的参数
cvNamedWindow("图像显示",1); //命名一个窗口 ,1为显示参数
imshow("图像显示",image);
cvWaitKey(0); //很重要,不写读不出来
③将读取的图片进行检测出人脸。
首先找到opencv目录下,识别人脸的类的文件(包装在data路径下)
Haarcascades_frontalface_default 包装的是 检测人脸,将这个文件拷贝到你的vs工程下。
#include <iostream>
#include <string>
#include <opencv2/core/core.hpp>
#include <opencv2/highgui/highgui.hpp>
#include <opencv2/gpu/gpu.hpp>
using namespace cv;
using namespace std;
string xmlPath="C:\\Users\\yu\\Documents\\Visual Studio 2010\\Projects\\加我南\\haarcascade_frontalface_default.xml";
//xmlpath 字符串记录那个.xml文件的路径
void detectAndDisplay(Mat image);
int main( int argc,char**argv )
{
string path="C:\\Users\\yu\\Documents\\Visual Studio 2010\\Projects\\test\\images\\1.jpg";//以检测图片1.jpg为例
Mat image =imread(path,-1);
CascadeClassifier a; //创建脸部对象
if(!a.load(xmlPath)) //如果读取文件不出错,则检测人脸
{
cout<<"无法加载xml文件"<<endl;
return 0;
}
detectAndDisplay(image);// 检测人脸
return 0;
}
void detectAndDisplay(Mat image)
{
CascadeClassifier ccf; //创建脸部对象
ccf.load(xmlPath); //导入opencv自带检测的文件
vector<Rect> faces;
Mat gray;
cvtColor(image,gray,CV_BGR2GRAY);
equalizeHist(gray,gray);
ccf.detectMultiScale(gray,faces,1.1,3,0,Size(50,50),Size(500,500));
for(vector<Rect>::const_iterator iter=faces.begin();iter!=faces.end();iter++)
{
rectangle(image,*iter,Scalar(0,0,255),2,8); //画出脸部矩形
}
Mat image1;
for(size_t i=0;i<faces.size();i++)
{
Point center(faces[i].x + faces[i].width / 2, faces[i].y + faces[i].height / 2);
image1= image(Rect(faces[i].x, faces[i].y, faces[i].width, faces[i].height));
}
imshow("1",image);
imshow("2",image1);
cvWaitKey(0);
}
实验结果如下:
④进行人脸检测
opencv的FaceRecogizer目前有三个类实现了它,特征脸和fisherface方法最少训练图像为两张,而LBP可以单张图像训练,LBP方法原理:
引用:http://blog.csdn.net/lsq2902101015/article/details/49717441
因此,我想到了与LBP算法类似的感知哈希算法。
说下原理过程:
(1)缩小尺寸:去除高频和细节的最快方法是缩小图片,将图片缩小到8x8的尺寸,共64个像素。不用保持纵横比,只需将其变成8x8的正方形,这样就可以摒弃不同尺寸、比例带来的图片差异
(2)简化色彩:将8x8的小图片转换成灰度图像。
(3)计算平均值:计算所有64个像素的灰度平均值
(4)比较像素的灰度:将每个像素的灰度,与平均值进行比较,大于或等于就记为1,小于均值,就记为0;
(5)计算hash值,将上面的比价比较结果组合在一起,构成了64位的哈希值,就是这张图片的指纹。
(6)通过比较两张图片的哈希值,计算差值得到汉明距离。汉明距离越小,说明两张图片越相似。
引用:http://blog.csdn.net/zouxy09/article/details/17471401
#include <iostream>
#include <string>
#include <opencv2/core/core.hpp>
#include <opencv2/highgui/highgui.hpp>
#include <opencv2/gpu/gpu.hpp>
using namespace cv;
string xmlPath="C:\\Users\\yu\\Documents\\Visual Studio 2010\\Projects\\加我南\\haarcascade_frontalface_default.xml";
string HashValue(Mat &src) //得到图片的哈希值
//很久之前写的,现在想不起来了...注释就先不写了.....抱歉哈。但是是可以运行的
{
string rst(64,'\0');
Mat img;
if(src.channels()==3)
cvtColor(src,img,CV_BGR2GRAY);
else
img=src.clone();
resize(img,img,Size(8,8));
uchar *pData;
for(int i=0;i<img.rows;i++)
{
pData=img.ptr<uchar>(i);
for(int j=0;j<img.cols;j++)
{
pData[j]=pData[j]/4;
}
}
int average=mean(img).val[0];
Mat mask=(img>=(uchar)average);
int index=0;
for(int i=0;i<mask.rows;i++)
{
pData = mask.ptr<uchar>(i);
for(int j=0;j<mask.cols;j++)
{
if(pData[j]==0)
rst[index++]='0';
else
rst[index++]='1';
}
}
return rst;
}
int HanmingDistance(string &str1,string &str2) //求两张图片的汉明距离
{
if((str1.size()!=64)||(str2.size()!=64))
return -1;
int diff=0;
for(int i=0;i<64;i++)
{
if(str1[i]!=str2[i])
diff++;
}
return diff;
}
void detectAndDisplay(Mat image)
{
CascadeClassifier ccf;
ccf.load(xmlPath);
vector<Rect> faces;
Mat gray;
cvtColor(image,gray,CV_BGR2GRAY);
equalizeHist(gray,gray);
ccf.detectMultiScale(gray,faces,1.1,3,0,Size(50,50),Size(500,500));
for(vector<Rect>::const_iterator iter=faces.begin();iter!=faces.end();iter++)
{
rectangle(image,*iter,Scalar(0,0,255),2,8); //画出脸部矩形
}
for(size_t i=0;i<faces.size();i++)
{
Point center(faces[i].x + faces[i].width / 2, faces[i].y + faces[i].height / 2);
image= image(Rect(faces[i].x, faces[i].y, faces[i].width, faces[i].height));
}
} //识别并截取人脸
int main( int argc, char** argv )
{
using std::cout;
using std::endl;
using std::cin;
cout<<"请输入想要选择的图片"<<endl;
int a,x,i;
int diff[9];
cin>>a;
const string path1=format("C:\\Users\\yu\\Documents\\Visual Studio 2010\\Projects\\test\\images\\%d.jpg",a);
Mat image1,image2;
image1=imread(path1,-1);
string str1,str2,path2;
cvNamedWindow("选择的图片",1);
/*cvResizeWindow("选择的图片",700,500);*/
imshow("选择的图片",image1);
detectAndDisplay(image1);
str1=HashValue(image1);
cvWaitKey(0);
for(i=1;i<=8;i++)//因为我完成的就是8张图片的检测,所以循环值为8
{
path2=format("C:\\Users\\yu\\Documents\\Visual Studio 2010\\Projects\\test\\images\\%d.jpg",i);
image2=imread(path2,-1);
detectAndDisplay(image2);
str2=HashValue(image2);
diff[i]=HanmingDistance(str1,str2);
}
int min=1000,t;
for(i=1;i<=8;i++) //循环值为8,求与原图片汉明距离最小的那张图片
{
if(min>diff[i]&&diff[i]!=0)
{
min=diff[i];
t=i;} //检测出的标记为t
}
path2=format("C:\\Users\\yu\\Documents\\Visual Studio 2010\\Projects\\test\\images\\%d.jpg",t);
image2=imread(path2,-1);//将图片t显示出来
cvNamedWindow("相似的图片",1);
imshow("相似的图片",image2);//这时显示的就是最相似的照片
cvWaitKey(0);
cin.get(); //吃掉回车符
}
实验结果如下:
我的照片库如下:
至此,简单地完成了检测并且识别人脸的功能。