(原)10-folder交叉验证

时间:2024-08-27 17:04:56

转载请注明出处:

http://www.cnblogs.com/darkknightzh/p/6069731.html

参考网址:

https://github.com/cmusatyalab/openface

说明:本内容根据CMU的openface的代码理解,不一定完全正确。

如果有6000个样本,则每次交叉验证时,取600个作为测试样本(如正负样本各300个),剩下的5400个作为训练样本。通过5400个训练样本(比如正负样本各2700个)得到分类最好的阈值(根据不同的阈值,得到此时的fpr和tpr,以及当前的ROC曲线)。通过该阈值计算600个测试样本的识别率。

经过10次之后,6000个样本均做过测试样本。从而得到这10个识别率的均值和标准差。

根据不同的fpr和tpr,可以得到最终的fprs和tprs的曲线,即最终的ROCs曲线。具体来说,在这10次测试中,每次fpr取一个值时(可以对fpr插值,使曲线更平滑),作为最终的fprs,将各自的tpr求平均,作为最终的tprs。fprs和tprs的曲线则为最终的ROCs曲线。