深度学习中的评价指标

时间:2022-02-05 09:46:21

0 分类问题评价指标

根据分类器在测试数据集上的预测或正确或不正确可以分为四种情况:
TP——将正类预测为正类数
FN——将正类预测为负类数
FP——将负类预测为正类数
TN——将负类预测为负类数

记忆方法:
T=True=+1            F=False=-1      (T和N并不是指代实际的是正类和负类)
P=Positive=+1      N=Negative=-1 (P和N指明了预测的是正类还是负类)
实际正例=+1         实际负例=-1

实际的正类和负类按照下面的方法:
TP的实际类别 = 1*1=1(实际正例)
FN的实际类别=-1*-1=1(实际正例)
FP的实际类别=-1*1=-1(实际负例)
TN的实际类别=1*-1=-1(实际负例)

因此:
TP+FN=实际正例的数量
TP+FP=预测正例的数量

准确率 a c c u r a c y = T P + T N P + N = = P + N

精确率 p r e c i s i o n = T P T P + F P = 被预测为正例的示例中实际为正例的比例

召回率 r e c a l l = T P T P + F N = 所有实际正例中有多少正例被找到

精确率和召回率的调和均值 F 1 2 F 1 = 1 p r e c i s i o n + 1 r e c a l l
即: F 1 = 2 T P 2 T P + F P + F N

1 目标检测中的mAP

转自知乎许博雅的回答
1.对于某个类别C,在某一张图片上
首先计算C在一张图片上的Precision=在一张图片上类别C识别正确的个数(也就是IoU>0.5)/一张图片上类别C的总个数
P r e c i s i o n C = N ( T r u e P o s i t i v e s ) C N ( T o t a l O b j e c t s ) C

2.依然对于某个类别C,可能在多张图片上有该类别,下面计算类别C的AP指数:
AP=每张图片上的Precision求和/含有类别C的图片数目
A v e r a g e P r e c i s i o n C = P r e c i s i o n C N ( T o t a l I m a g e s ) C

3.对于整个数据集,存在多个类别C1、C2、C3:
mAP=上一步计算的所有类别的AP和/总的类别数目
相当于所有类别的AP的平均值
M e a n A v e r a g e P r e c i s i o n = A v e r a g e P r e c i s i o n C N ( c l a s s e s )

2 混淆矩阵

转自知乎松北wmh的回答
举个例子:
对一百张图片进行学习分类,其中包含 火星(50张),地球(30张),冰激凌(20张) 三个种类;
在算法学习过程中需要对每次的叠代分类结果进行精度评估,用到混淆矩阵这一工具。 如下图,每次叠代后列出当前各类别分类状态的混淆矩阵。

第一次叠代后混淆矩阵为:
深度学习中的评价指标
第二次叠代后混淆矩阵为:
深度学习中的评价指标
经过若干叠代,最终分类结果全部正确,混淆矩阵如下:
深度学习中的评价指标
混淆矩阵的作用:
1)用于观察模型在各个类别上的表现,可以计算模型对应各个类别的准确率,召回率;
2)通过混淆矩阵可以观察到类别直接哪些不容易区分,比如A类别中有多少被分到了B类别,这样可以有针对性的设计特征等,使得类别更有区分性;

分割线***********************************************************************************分割线
转自博客
深度学习中的评价指标