文件名称:InsuranceProject:项目相关文件
文件大小:7.06MB
文件格式:ZIP
更新时间:2024-04-20 13:20:10
JupyterNotebook
保险项目 在此项目中,我处理以下数据:数据集:healthcare_census.csv(163,065行,19列) 我关于此数据的完整工作流程为:1.数据收集2.研究数据:1.观察到的数据集。 2.了解列的格式。 3.检查列的数据类型。 3.数据清洁:1.删除无关的重复列。 2.将数字列的类型从字符串更改为浮点型。 4.数据可视化:使用条形图,饼图可视化数据。 前任。 每个州的医疗保险提供者数。 5.数据分析:1.相关热图2.一键编码3.数据标准化4. PCA 6.模型构建:1.分离列和测试数据。2.模型拟合。 7.预测:1.比较所有模型的结果2.结论
【文件预览】:
InsuranceProject-main
----FINAL_all_regression_70_30 .ipynb(2.15MB)
----Modified Project ppt.pptx(499KB)
----healthcare_census.rar(3.37MB)
----REPORT_Regression_Modified.pdf(1.22MB)
----Medicare.jpeg(48KB)
----README.md(985B)
----FINAL_viz.ipynb(882KB)