文件名称:cvd_factors:心血管疾病分类
文件大小:15.81MB
文件格式:ZIP
更新时间:2024-04-15 22:50:37
JupyterNotebook
单元3专案 介绍 目标: 心血管疾病(CVD)是全球主要的死亡原因,每年夺走约1700万人的生命。 我们对该项目的目标是,在预测CVD的患病率时,提供能够识别和定义保护因素和风险因素的最佳模型。 通过了解这些因素,我们将能够针对最佳的一级预防方法,并帮助阻止患者中某些CVD的可能发展。 问题: 就准确性而言,这类数据集表现最佳的“原始”模型是什么? 在对有和没有CVD的患者进行分类时,最重要的因素是什么? 在预测观察结果是否患有CVD时,最重要的风险和保护因素是什么? 方法 在这个项目中,我们将使用OSEMN流程: 获取:我们的数据集是从Kaggle的网站收集的,然后下载到我们计算机上的本地文件中。 检查和清理:这是我们检查干净数据的地方。 在本节中,我们将寻找:离群值,空值,确保某些列中的值合理,并查看每列中的值的类型(分类与数字)。 探索:我们会查看数据以及要素与目标之
【文件预览】:
cvd_factors-master
----models()
--------recall_rf.pickle(1.46MB)
--------best_xgb.pickle(4.73MB)
--------best_rf.pickle(24.61MB)
--------best_svc.pickle(7.68MB)
----images()
--------output_87_1.png(14KB)
--------output_106_1.png(24KB)
--------output_129_5.png(26KB)
--------output_141_1.png(25KB)
--------output_87_3.png(17KB)
--------output_129_8.png(26KB)
--------output_63_1.png(8KB)
--------output_27_0.png(10KB)
--------output_145_1.png(25KB)
--------output_148_2.png(13KB)
--------output_129_1.png(26KB)
--------output_70_0.png(11KB)
--------output_148_1.png(25KB)
--------output_87_2.png(19KB)
--------output_87_4.png(15KB)
--------output_87_6.png(16KB)
--------output_49_0.png(11KB)
--------output_54_0.png(11KB)
--------output_59_0.png(11KB)
--------output_129_12.png(12KB)
--------output_87_0.png(22KB)
--------output_129_11.png(25KB)
--------output_31_0.png(6KB)
--------output_63_0.png(9KB)
--------output_158_1.png(26KB)
--------output_62_0.png(9KB)
--------output_129_3.png(25KB)
--------output_129_9.png(13KB)
--------output_43_0.png(14KB)
--------output_87_5.png(12KB)
--------output_166_1.png(50KB)
--------output_76_0.png(63KB)
--------output_63_2.png(8KB)
--------output_141_2.png(14KB)
--------output_74_0.png(9KB)
--------output_129_6.png(12KB)
----cvd_osemn.ipynb(1.78MB)
----LICENSE(1KB)
----cvd.csv(2.81MB)
----README.md(59KB)
----df_clean.pickle(7.67MB)
----CVD Classification.pdf(1.04MB)