文件名称:模型评估-人脸识别图像预处理技术
文件大小:4.91MB
文件格式:PDF
更新时间:2024-06-29 11:23:52
数据挖掘算法 Python
第十一章 模型评估 11.1 ROC 曲线 1. ROC 曲线: 接收者操作特征(receiver operating characteristic),roc 曲线上每个点反映着对同一信 号刺激的感受性 横轴:负正类率(false positive rate,FPR)特异度 Specificity 代表分类器预测的正类中实际负实例占所有负实例的比例。1-Specificity 纵轴:真正类率(true positive rate,TPR)灵敏度 Sensitivity(正类覆盖率) 代表分类器预测的正类中实际正实例占所有正实例的比例。Sensitivity 2. 针对二分类问题,将实例分成正类(postive)或者负类(negative)。但是实际中分类时,会出现四种 情况. (1)若一个实例是正类并且被预测为正类,即为真正类(True Postive TP) (2)若一个实例是正类,但是被预测成为负类,即为假负类(False Negative FN) (3)若一个实例是负类,但是被预测成为正类,即为假正类(False Postive FP) (4)若一个实例是负类,但是被预测成为负类,即为真负类(True Negative TN) 3. 分类模型的性能根据模型正确和错误预测的检验记录计数进行评估,这些计数存放在称作混淆矩 阵(confusion matrix)的表格中 列联表如下: 由上表可得出横,纵轴的计算公式: (1)真正类率(True Postive Rate)TPR: TP/(TP+FN),代表分类器预测的正类中实际正实例占所有正实例 的比例。Sensitivity ------- 纵坐标 (2)负正类率(False Postive Rate)FPR: FP/(FP+TN),代表分类器预测的正类中实际负实例占所有负实 例的比例。1-Specificity ------ 横坐标