最终项目:死亡原因分析最终项目

时间:2021-02-20 15:34:19
【文件属性】:
文件名称:最终项目:死亡原因分析最终项目
文件大小:11.31MB
文件格式:ZIP
更新时间:2021-02-20 15:34:19
JupyterNotebook 美国死亡原因最终项目 背景: 科学家一直在努力寻找导致死亡的因素,无论是行为,环境还是财务上的原因。 这是受到当前健康意识,健康习惯改善和预期寿命增加趋势的启发。 根据CDC,美国健康排名组织和经济分析局提供的数据,我们希望分析2011年至2016年这5年时间范围内与美国死亡率相关的因素。 目标: 在州和国家一级,分析烟草使用,肥胖率和人均收入之间的关系,以了解死亡人数 假设: 肥胖,烟草和收入都是与死亡人数成正相关的因素 探索变量: 烟草使用率,肥胖率,人均收入,死亡人数 使用的工具: 熊猫,Matplotlib,Tableau,Scikit-Learn,HTML,CSS,Bootstrap 机器学习趋势: R2为.56,表明模型解释了均值附近数据变异性的约56%。 状态之间的差异非常明显,可能导致异常,并导致分析结果偏斜。 平均得分误差显示了预测值和实际值之间的平均平方差为
【文件预览】:
Final-Project-master
----original_datasets()
--------alcohol_consumption.csv(11KB)
--------per_cap_income_us.csv(8KB)
--------Behavioral_Risk_Factor_Data__Tobacco_Use__2011_to_present_.csv(7.07MB)
--------obesity.csv(22.27MB)
--------leading_causes_death_us.csv(15KB)
----data()
--------death_data.json(428B)
--------merged_results.json(66KB)
----notebooks_datasets()
--------alcohol_consumption.ipynb(37KB)
--------data_cleaning_leading_causes.ipynb(26KB)
--------data_cleaning_income.ipynb(26KB)
--------Data_Cleanup_Obesity.ipynb(739KB)
--------Machine_Learning_Before.ipynb(74KB)
--------Cleanup.ipynb(95KB)
--------data_cleaning_tobacco.ipynb(43KB)
--------.ipynb_checkpoints()
--------Machine_Learning_Final.ipynb(155KB)
----Final Project-Leading Causes of Death.pptx(5.73MB)
----index.html(7KB)
----WebVisualizations()
--------tableau.html(6KB)
--------data.html(4KB)
--------machine-learning.html(7KB)
----static()
--------css()
--------images()
--------js()
----clean_datasets()
--------clean_alcoholdata.csv(1KB)
--------final_cleaned_income_us.csv(2KB)
--------database()
--------cleaned_leading_causes.csv(2KB)
--------clean_tobacco.csv(1KB)
--------clean_obesity.csv(6KB)
--------death_natl.csv(108B)
--------merged_results.csv(12KB)
--------NJ_analysis_df.csv(290B)
----Tableau Visualizations()
--------Table.twb(187KB)
----Machine Learning Analysis()
--------Machine Learning-Website.docx(360KB)
----README.md(4KB)

网友评论