ROC曲线是FPR和TPR的点连成的线。

PR曲线是准确率和召回率的点连成的线。

当样本分布极不均衡的时候,哪个曲线表现的更好呢? 先看两个公式: 1) TPR = TP / (TP + FN); 2) FPR = FP / (FP + TN) 在ROC曲线中,这两个指标构成了最后的曲线。 如果,样本极不均衡。这里假设,正样本非常少,负样本非常多。 如果是这样的话,则TN会非常大,将FPR拉低,最后的曲线会表现的非常好。 这时候,再看看PR曲线,也许这个曲线就没有表现的那么好。 所以,有的时候,光看一个曲线是不能完全覆盖所有的情况的。
如何画ROC曲线?