【文件属性】:
文件名称:颜色分类leetcode-dsc-roc-curves-and-auc-lab:dsc-roc-curves-and-auc-lab
文件大小:948KB
文件格式:ZIP
更新时间:2021-07-06 23:41:28
系统开源
颜色分类leetcode
ROC
曲线和
AUC
-
实验室
介绍
在本实验中,您将练习绘制
ROC
图形、计算
AUC
并解释这些结果。
在此过程中,您还将通过简单地拟合标准数据科学管道中的模型来进一步审查逻辑回归。
目标
你将能够:
创建
ROC
曲线的可视化并使用它来评估模型
使用适合特定问题的评估指标评估分类模型
训练模型
首先重复我们讨论过的前面的建模步骤。
对于此问题,您将获得一个数据集'mushrooms.csv'
。
您的第一份工作是在数据集上训练LogisticRegression分类器,以确定蘑菇是可食用的
(e)
还是有毒的
(p)。
数据集class的第一列指示蘑菇是否有毒或可食用。
但首先,
导入数据
打印数据的前五行
打印
DataFrame
的.info()
#
Import
and
preview
the
data
df
=
None
下一步是定义预测变量和目标变量。
您是否注意到所有列都是object类型?
因此,您需要首先创建虚拟变量。
首先,为'class'列创建一个虚拟变量。
确保你放弃第一级
从df删除'class'列,然后为所有剩余的列创建虚
【文件预览】:
dsc-roc-curves-and-auc-lab-master
----images()
--------lesson_roc_graph.png(33KB)
--------prob_distro.png(5KB)
--------poor_good_seperability.png(5KB)
--------decision_boundary_recall_preferred.png(436KB)
--------decision_boundary_accuracy.png(386KB)
--------roc_comp.jpg(18KB)
--------logit_probs_cutoff.jpeg(21KB)
----heart.csv(11KB)
----CONTRIBUTING.md(2KB)
----mushroom-classification.zip(30KB)
----index.ipynb(7KB)
----LICENSE.md(1KB)
----.gitignore(64B)
----.learn(87B)
----mushrooms.csv(365KB)
----README.md(5KB)