今天我们主要来看看机器学习中分类器的一些评价指标,主要包括召回率(recall), 精度(precision), 准确率(accuracy), F1分数(F1-score). 大多数刚接触分类器的同学可能对这几个指标在二分类下的计算方式比较清楚,但是放到多分类任务上就有些模糊。那我们今天就仔细来看一下这几个指标在二分类和多分类下的计算方式。
一、二分类的评价指标
首先我们来看一个非常熟悉的表格:
|
|
预测的类 |
|
|
|
|
Yes |
No |
合计 |
实际的类 |
Yes |
TP |
FN |
P |
No |
FP |
TN |
N |
|
|
合计 |
P’ |
N’ |
P+N |
首先来解释一下表格中的术语:
1. 真正例/真阳性(True Positive, TP):指被分类器正确分类的正元组。令TP为真正例的个数。
2. 真负例/真阴性(True Negative, TN):指被分类器正确分类的负元组。令TN为真负例的个数。
3. 假正例/假阳性(False Positive, FP):指被分类器错误标记为正元组的负元组。令FP为假正例的个数。
4. 假负例/假阴性(False Negative, FN):指被分类器错误标记为负元组的正元组。令FN为假负例的个数。
5. 正元组数(Positive, P):样本中实际的正元组数。
6. 负元组数(Negative, N):样本中实际的负元组数。
7. P’:被分类器分为正元组的样本数。
8. N’:被分类器分为负元组的样本数。
那么分类器的几个常用评价指标可以表示为:
准确率/识别率(accuracy): ;
召回率(recall):;
精度(precision):;
F1分数(F1-score):.
二、多分类的评价指标
其实多分类的评价指标的计算方式与二分类完全一样,只不过我们计算的是针对于每一类来说的召回率(recall), 精度(precision), 准确率(accuracy)和 F1分数(F1-score). 对于某一个确定的类别来讲,P其实就是实际属于这一类中的样本,N其实就是实际属于其他类的所有样本,P’其实就是被分类器分类这一类的所有样本,N’就是被分类器分类为其他类的所有样本数。这样来看,对于这一确定的类别来讲,它的召回率(recall)是指被分类器正确分类的属于这个类别的样本数与实际上属于这一类别的总样本数的比值;它的精度(precision)是指被分类器正确分类的属于这个类别的样本数与所有被分类器分为这一类别的样本数的比值。多分类分类器的准确率/识别率(accuracy)是指所有类别中被分类器分类正确的样本总数与所有样本数的比值。
(⊙v⊙)嗯~感觉已经解释的蛮清楚了呀!
以上!!!