计算机视觉(六)

时间:2023-01-09 08:48:22

    人脸检测和识别

    在opencv中data/haarcascades,该文件夹包含了所有的opencvv人脸检测的xml文件,这些文件用于检测静止图像、视频和摄像头所得到的图像中的人脸。

使用时直接索引到该文件。

1、静态图像中的人脸检测

级联分类

def CascadeClassifier(filename=None): # real signature unknown; restored from __doc__  """ CascadeClassifier([filename]) -> <CascadeClassifier object> """  pass
from cv2 import *
image=imread('D:/temp/f1.jpg')
def detect(frame):
    #负责人脸检测
    face_cascades=CascadeClassifier('D:/cascades/haarcascade_frontalface_default.xml')
    
    #必须转换成灰度图
    gray=cvtColor(frame,COLOR_BGR2GRAY)
    
    #实际的人脸检测
    faces=face_cascades.detectMultiScale(gray,1.3,5)
    
    #通过依次提取faces变量中的值来找到人脸,并在人脸周围绘制红色矩形,这是在原始图像而不是在灰度图上
    for (x,y,w,h) in faces:
        frame=rectangle(frame,(x,y),(x+w,y+h),(0,0,255),2)
        
    namedWindow('Detected')
    imshow('Detected',frame)
    waitKey()


detect(image)
destroyAllWindows()

2、视频中的人脸检测
 
from cv2 import *

videocaptrue=VideoCapture(0)

ret,frame=videocaptrue.read()

def detect(frame):
    face_cascades=CascadeClassifier('D:/cascades/haarcascade_frontalface_default.xml')

    # img=imread(filename)
    gray=cvtColor(frame,COLOR_BGR2GRAY)
    faces=face_cascades.detectMultiScale(gray,1.3,5)

    for (x,y,w,h) in faces:
        frame=rectangle(frame,(x,y),(x+w,y+h),(0,0,255),2)
    namedWindow('Detected')
    imshow('Detected',frame)
    waitKey(1)

while ret:
    detect(frame)
    ret, frame = videocaptrue.read()
destroyAllWindows()

3、视频中人脸及眼睛
来源:http://bluewhale.cc/2017-07-28/use-python-and-opencv-to-detect-faces-and-eyes.html

使用numpy和cv2两个库。

Source code 计算机视觉(六) 计算机视觉(六) 计算机视觉(六) 
#导入所需库文件
import numpy as np
import cv2


加载Haar特征分类器中的面部识别和眼睛识别两个xml文件。如何你还需要识别更多的元素也在这里一并加载。

Source code 计算机视觉(六) 计算机视觉(六) 计算机视觉(六) 
#加载面部识别文件(请按文件实际存储路径进行调整)
#https://github.com/Itseez/opencv/blob/master/data/haarcascades/haarcascade_frontalface_default.xml
face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')
#加载眼部识别文件(请按文件实际存储路径进行调整)
#https://github.com/Itseez/opencv/blob/master/data/haarcascades/haarcascade_eye.xml
eye_cascade = cv2.CascadeClassifier('haarcascade_eye.xml')


打开你的摄像头来获取视频,到这一步摄像头开始工作,但还没有任何影像输出。如果没有摄像头可以使用电脑里的视频文件进行替代。

Source code 计算机视觉(六) 计算机视觉(六) 计算机视觉(六) 
#打开摄像头获取视频
cap = cv2.VideoCapture(0)


我们同时将对摄像头获取的图像进行保存,这里对视频文件进行处理并设置保存路径及视频尺寸。(这一步不是必须的操作)

Source code 计算机视觉(六) 计算机视觉(六) 计算机视觉(六) 
#编译并输出保存视频
fourcc = cv2.VideoWriter_fourcc(*'XVID')
out = cv2.VideoWriter('output.avi',fourcc, 20.0, (640,480))


开始获取并处理视频内容。下面是一个无限的循环结构,通过按键q可以结束循环。在这个循环中ret获取摄像头是否有返回的布尔值,img获取摄像头拍摄的视频内容。我们首先将摄像头获取的彩色图像转化为灰度图像。后续的操作将主要在灰度图像上完成,然后再使用灰度图像中的坐标对原始的彩色图像进行标记和输出。图像转化为灰度后首先进行人脸检测,然后在人脸检测的基础上再进行眼睛检测,这样做的原因有两点,1,避免面部以外的物体被错误的识别为眼睛,2,眼睛识别算法需要一些眼睛周围的面部特征来进行检测,从而提高准确率。

随后使用矩形绘制出人脸的位置和眼睛的位置,在设置绘制颜色时需要注意,OpenCV中的颜色值并不是RGB,而是BRG。检测和绘制完成后对图像进行输出。这时可以在视频窗口中看到被标记的面部和眼睛。由于我们使用的Haar特征分类器是正面面部识别,因此需要正对摄像头。如果面部发生偏转则无法识别。

Source code 计算机视觉(六) 计算机视觉(六) 计算机视觉(六) 

#无限循环
while(True):
    #获取视频及返回状态
    ret, img = cap.read()
    #将获取的视频转化为灰色
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    #检测视频中的人脸,并用vector保存人脸的坐标、大小(用矩形表示)
    faces = face_cascade.detectMultiScale(gray, 1.3, 5)
 
    #脸部检测
    for (x,y,w,h) in faces:
        cv2.rectangle(img,(x,y),(x+w,y+h),(255,0,0),2)
        roi_gray = gray[y:y+h, x:x+w]
        roi_color = img[y:y+h, x:x+w]
        #检测视频中脸部的眼睛,并用vector保存眼睛的坐标、大小(用矩形表示)
        eyes = eye_cascade.detectMultiScale(roi_gray)
        #眼睛检测
        for (ex,ey,ew,eh) in eyes:
            cv2.rectangle(roi_color,(ex,ey),(ex+ew,ey+eh),(0,255,0),2)
 
    #显示原图像
    cv2.imshow('img',img)
    #按q键退出while循环
    if cv2.waitKey(30) & 0xFF == ord('q'):
        break


退出while循环后释放摄像头,完成视频输出并关闭所有窗口。

Source code 计算机视觉(六) 计算机视觉(六) 计算机视觉(六) 
#释放摄像头
cap.release()
#关闭视频输出
out.release()
#关闭所有窗口
cv2.destroyAllWindows()


4、人脸识别

定义:程序能识别给定图像或视频中的脸。

方法:用一系列分好类的图像(人脸数据库)来“训练”程序,并基于这些图像来进行识别。

4.1生成人脸识别数据

需满足以下条件:

--图像是灰度格式,后缀名为.pgm

--图像形状为正方形

--图像大小要一样(以下使用200x200的大小)


脚本代码:

from cv2 import *
def generate():
    face_cascades = CascadeClassifier('D:/cascades/haarcascade_frontalface_default.xml')
    eye_cascades = CascadeClassifier('D:/cascades/haarcascade_eye.xml')
    videocap=VideoCapture(0)
    count=0
    while 1:
        ret,frame=videocap.read()
        gray=cvtColor(frame,COLOR_BGR2GRAY)
        faces=face_cascades.detectMultiScale(gray,1.3,5)

        for (x,y,w,h) in faces:
            img=rectangle(frame,(x,y),(x+w,y+h),(255,0,0),2)

            f=resize(gray[y:y+h,x:x+w],(200,200))
            imwrite('D:/temp/Mypic/%s.pgm'%str(count),f)
            count+=1
        imshow('Camer',frame)
        if waitKey(1000/12)&0xff==ord('q'):
            break
    videocap.release()
    destroyAllWindows()

if __name__=='__main__':
    generate()

过程:人脸检测,裁剪灰度帧的区域,将其大小调整为200x200像素,保存在指定的文件夹中,文件的后缀名为.pgm。需要一个count对图像进行编号。

待续。。。