【文件属性】:
文件名称:kaggle-titanic:适用于Kaggle Titanic竞赛的Jupyter笔记本
文件大小:6KB
文件格式:ZIP
更新时间:2021-04-05 06:38:43
卡格勒-泰坦尼克号
适用于Kaggle Titanic竞赛的Jupyter笔记本
诊断以改进Titanic Kaggle竞赛中的模型
,2021年4月
1912年4月15日发生的泰坦尼克号沉没是历史上最著名的海难之一。 它构成了Kaggle入门的基础。 这场比赛的基础是二进制分类问题:根据泰坦尼克号上乘客的特征,预测泰坦尼克号沉没后他们是否还幸免于难。
在本笔记本中,我将经历设计最佳模型以预测生存的过程:
对问题的理解
数据探索
清理数据
特征工程
选型
模型的超参数优化
模型测试
我在Kaggle竞赛中补充了机器学习问题的这些常见元素,重点是以下内容:
使用混淆矩阵,ROC曲线和曲线下面积(AUC)分数评估模型预测。 这样可以深入了解修改二元分类器的阈值,以减少误报或误报(I型和II型错误),这适用于许多二元分类问题,例如医疗保健中的问题。
诊断会根据模型中存在偏差或变异的证据,
【文件预览】:
kaggle-titanic-main
----LICENSE(11KB)
----README.md(3KB)