1 致谢
感谢网友生活不只*眼前的苟且的帮助,
原文链接如下:
https://blog.csdn.net/u011734144/article/details/79985917
2 前言
今天在阅读FaceBoxes的论文~
读的时候有的地方没有看懂,就是评测指标这里,
这里使用了一个指标叫做mAP,我先以为这个mAP是“多分类中的mAP指标”,后来看来一下作者GitHub中给出的链接,
然后我用代码试了一下,发现是如下的结果,
可以看到,这里的横坐标是 False positives(也就是FP的数量),纵坐标是 True positive rate,也就是医学中常用的真阳率,我感觉这篇博客《真阳率(true positive rate)、假阳率(false positive rate),AUC,ROC》写的还是挺好的,其实TPR的概率起源于医学中,主要指的是分辨医学指标显示为阳性、然后也确实患病的概率,由此可以来评价这个指标的准确度~
3 人脸检测中mAP的含义
首先,我们需要明确的是,人脸检测中的mAP与多分类中的mAP指标是不同的,
它指的是:在不同得分阈值下对TP的判断标准不同,于是会对应不同数量的 false Positive,从而与不同TPR的对应的关系;
其实我们仔细看看TPR的定义就会知道,TRP其实就是recall;
由此产生的曲线,即为mAP的曲线,也就是我们在前言中展示的曲线图,实际上就是不同阈值下recall值的曲线图;
对于论文中使用的指标,我们再来看看其表述,
他们使用的是在出现1000个FP时的TPR,相当于这里使用1000个FP动态规定了score判定正负样本的阈值,并计算此时的recall;
但是这里如何根据FP数据进行统计呢,我们再来回顾一下这个TPR-FP的曲线,
一个比较奇怪的情况是,这里的横坐标是 False positives,那么我们怎么根据FP数目再来统计TPR呢?
其实方法跟多分类中的统计是类似的,将模型输出的bbox按照score进行从高往低排序,然后逐个统计不同TRP情况下FP的数目;