风控模型中计算K-S值方法:
K-S值主要验证风控模型对违约对象的区分能力,通常是在风控模型预测完全体样本的风控评分后,将全体样本按是否违约分为两部分,然后用K-S值检验两组样本的风控评分是否有显著差异
将全体样本按风控评分从低到高排序均分成十组,分别计算每组的实际好样本数、实际坏样本数、累计好样本数、累计坏样本数、累计好样本数占比(总好样本数)、累计坏样本数占比(总坏样本数)、abs(累计好样本数占比-累计坏样本数占比)
K-S值=max(abs(累计好样本数占比-累计坏样本数占比)),K-S值只能反映出哪个分段是区分最大的
全体样本被分为十等份,每份样本风控评分的最大值可视为阈值(小于阈值则预测为好样本),则累计好样本数占比为真阳性率,累计坏客户占比为假阳性率。K-S曲线的横坐标是等分值,纵坐标分别是TPR+FRP累计值
K-S值>0.2即可认为模型具有比较好的预测准确性,值越大表示模型的区分度越好