文件名称:Logistic-Regression-Random-Forest-Gradient-Boosting
文件大小:6.38MB
文件格式:ZIP
更新时间:2024-04-18 09:43:57
JupyterNotebook
介绍 该分类项目的目的是预测一个人是否会提出索赔。 包括Logistic回归,Random Forest和XGBoost在内的多个模型的多重排列均未产生明显的结果,因此,我们必须得出结论,数据不是可预测的。 最初,迭代是在使用sklearn的SMOTE来对少数族裔目标类进行升采样和使用python的.resample() (分别是各个笔记本的标题)之间进行划分的。 可以在“ Results_Snapshot.xlsx”文件中查看每个模型得分的快照。 XGBoost上的网格搜索产生了最佳结果。 但是,我们确实获得了有用和多余功能的见识,并且可以开始将精力集中在为这些功能收集更多数据上。 我们还可以识别新的数据点并进行特征工程,以生成可预测的数据集并充满信心地回答我们的问题。
【文件预览】:
Logistic-Regression-Random-Forest-Gradient-Boosting-master
----LogReg_RF_XGBoost_with_ReSample.ipynb(1.92MB)
----Business_Presentation.pdf(372KB)
----ReadMe.md(939B)
----autoinsurance_claims.csv(5.48MB)
----LogReg_RF_XGBoost_with_crossVal.ipynb(428KB)
----autoinsurance_claims_variable glossary_final.xlsx(15KB)
----LogReg_RF_XGBoost_with_SMOTE.ipynb(1.41MB)
----.ipynb_checkpoints()
--------FP3-V12_ReSample-checkpoint.ipynb(1.24MB)
--------plot_roc_crossval-checkpoint.ipynb(43KB)
--------FP3-V12_crossVal-checkpoint.ipynb(427KB)
--------Predictions_with_SMOTE-checkpoint.ipynb(1.41MB)
--------FP3-V12_SMOTE-checkpoint.ipynb(1.41MB)
--------playground-checkpoint.ipynb(17KB)