模型评估方法-K-S值

风控模型中计算K-S值方法：

K-S值主要验证风控模型对违约对象的区分能力，通常是在风控模型预测完全体样本的风控评分后，将全体样本按是否违约分为两部分，然后用K-S值检验两组样本的风控评分是否有显著差异

将全体样本按风控评分从低到高排序均分成十组，分别计算每组的实际好样本数、实际坏样本数、累计好样本数、累计坏样本数、累计好样本数占比(总好样本数)、累计坏样本数占比(总坏样本数)、abs(累计好样本数占比-累计坏样本数占比)

K-S值=max(abs(累计好样本数占比-累计坏样本数占比))，K-S值只能反映出哪个分段是区分最大的

全体样本被分为十等份，每份样本风控评分的最大值可视为阈值(小于阈值则预测为好样本)，则累计好样本数占比为真阳性率，累计坏客户占比为假阳性率。K-S曲线的横坐标是等分值，纵坐标分别是TPR+FRP累计值

模型评估方法-K-S值

K-S值>0.2即可认为模型具有比较好的预测准确性，值越大表示模型的区分度越好

秒客网