文件名称:颜色分类leetcode-ds-roc-auc-nyc-ds-100218:ds-roc-auc-nyc-ds-100218
文件大小:891KB
文件格式:ZIP
更新时间:2024-07-26 16:56:31
系统开源
颜色分类leetcode AUC 和 ROC 到目前为止,我们的一些准确度得分可能看起来非常令人印象深刻; 第一次尝试时,80% 的准确率似乎非常好! 我们必须记住的是,在预测二元分类时,我们有时肯定是对的,即使只是猜测。 例如,在猜测硬币是否正面朝上时,我应该有大约 50% 的准确率。 这也可能导致在调整模型的过程中出现问题。 如果您有一个包含罕见事件(例如疾病或中奖)的偏斜数据集,其中 1000 个中只有 2 个阳性病例,那么即使是将所有内容都归类为“非会员”的简单算法也将达到 99.8% 的准确率(1000 次中有 998 次是正确的)。 因此请记住,必须将 80% 的准确率考虑到更大的上下文中。 有了这个,分析分类错误的另一种方法是使用 AUC,它代表“曲线下面积”。 你问什么曲线? Receiver Operater Curve (ROC Curve),它说明了我们分类器的误报率与误报率。 在训练分类器时,我们希望 ROC 曲线能够紧贴图形的左上角。 50-50 准确率的分类器被认为“毫无价值”; 这并不比随机猜测更好,就像抛硬币一样。 ROC 曲线为我们提供了这种假阳性率和
【文件预览】:
ds-roc-auc-nyc-ds-100218-master
----README.md(6KB)
----index_files()
--------index_11_1.png(33KB)
----heart.csv(11KB)
----.learn(86B)
----index.ipynb(9KB)
----.ipynb_checkpoints()
--------index-checkpoint.ipynb(9KB)
----images()
--------logit_probs_cutoff.jpeg(21KB)
--------prob_distro.png(5KB)
--------roc_comp.jpg(18KB)
--------poor_good_seperability.png(5KB)
--------decision_boundary_recall_preferred.png(436KB)
--------.DS_Store(6KB)
--------decision_boundary_accuracy.png(386KB)
----.DS_Store(6KB)