论文阅读笔记

时间:2022-01-29 06:33:41

梳理:

A Convolutional Neural Network Cascade for Face Detection是CNN与级联思想在检测的应用

From Facial Parts Responses to Face Detection A Deep Learning Approach是关键点检测与CNN结合的思想

Object Detection with Pixel Intensity Comparisons Organized in Decision Trees 是决策树思想

Joint Cascade Face Detection and Alignment 是用决策树实现检测与矫正结合的思想

Face Alignment at 3000 FPS via Regressing Local Binary Features 是上文的关键点检测算法

 

实现思路:

研究主要集中于以下三点内容:

第一部分是关于特征的设计与选择,有效的特征能够表达图像中所蕴藏的信息,同时又足够简单,有助于减少计算量。

第二部分是关于人脸检测与矫正的结合方法,人脸检测与矫正,一个是二分类问题,一个是回归问题,将二者结合在一起的目的不仅仅是为了节省时间效率,更是为了利用矫正的结果提高人脸检测的准确率与速度。

第三部分是关于决策树与卷积神经网络级联结构的设计,该卷积神经网络需要与决策树相契合,一种做法是在级联的前端选择决策树,后端选择卷积神经网络,这样可以在前端过滤掉大多数负例,在后端利用CNN来保证较高的正确率。

各个部分的关键问题主要集中于以下几点:

1、关于特征的选择,由于人类检测与矫正需要在同一步完成,那么就需要这种特征既能用于人脸检测,又能用于人脸矫正,这需要它具有广泛的适用性。

2、人脸检测与矫正的结合方式无论是决策树还是卷积神经网络,虽然都已有实现的先例,但由于我们的框架采用了决策树与神经网络混合的结构,那么就不能只是生硬的衔接二者,否则会使整个框架过于复杂,需要重新设计二者算法,使其流畅的贯穿于整个过程。

3、目前决策树与卷积神经网络的结合并没有被广泛认可的实现,实现一种真正能一加一大于二的联合方式将是本文的重点与难点。

初步技术思路:

针对第一部分,特征的选择上应以简单与有效为首要,针对随机像素点或是以LBP提取像素域的随机对比有着出色的表现效果,可以延用或是设计一种新的特征表达方法。

针对第二部分,人脸检测与矫正的结合,在决策树方面,近年来已有其分类树与回归树的加权结合方法[8],而在卷积神经网络方面,也提出一种以关键点为特征的检测人脸的神经网络结构[7],Yang S等人提出的DCN网络结构虽然能在一轮卷积计算中计算出所有的特征map,但是在大多数实际应用中,图片中的人脸数量主要为一个且位于中心,如果能够利用决策树在前期提供一些候选人脸区域,然后再用DCN分别卷积计算这些小的人脸区域,虽然卷积轮数变多了,但是由于输入图片变小,计算量是指数级下降的。

针对第三部分,决策树与卷积神经网络的结合,目前决策树的级联框架较为常见,卷积神经网络的级联结构也已有实现,可以将二者去头掐尾的结合到一起,但是也可以设计出一种更简洁有效的拓扑结构将二者级联到一起。