评价指标
准确率、召回率和F1
分类结果混淆矩阵如下
分类结果 | 正例 | 反例 |
---|---|---|
正例 | TP(真正例) | FN(假反例) |
反例 | FP(假正例) | TN(真反例) |
T: True
F: False
P: Positive
N: Negtive
准确率: P
召回率: R
F1: F1度量
P-R曲线:横轴为P,纵轴为R
比较A与B两个学习器的高低,一个比较合理的判据是比较P-R曲线下的面积的大小,它在一定程度上表征了学习器在准确率和召回率上取得相对双高的比例。但这个值不大容易估算,因此,选用平衡点来度量。
平衡点(Break Event Point, BEP): P=R时的取值
ROC和AUC
ROC, Receiver Operating Characteristic 受试者工作特征
AUC, Area under curve
在进行学习器的比较时,与P-R图类似,若一个学习期的ROC曲线被另一个学习器的曲线完全包住,则可以断言后者的性能优于前者;若两个学习器的ROC曲线发生交叉,则难以一般性的断言两者孰优孰劣。此时如果一定要进行比较,则较为合理的判据是比较ROC曲线下的面积,即AUC。
ROC(Receiver Operating Characteristic)曲线和AUC常被用来评价一个二值分类器(binary classifier)的优劣
真正例率:True Positive Rate
假正例率:False Positive Rate
ROC曲线:横轴是FPR,纵轴是TPR
比较A与B两个学习器的优劣,比较为合理的判据是比较ROC曲线下的面积,即AUC。
TSS, RSS, ESS,
R2
- TSS: Total Sum of Squares, 样本总平方和
即样本的伪方差的m倍
- RSS: Residual Sum of Squares, 残差平方和
-
R2
若预测值恒为样本期望,则
- ESS: Explained Sum of Squares
只有在无偏估计时,
ESS又称回归平方和SSR(Sum of Squares for Regression)