文件名称:Data_Science_Portfolio:这是我完成的数据科学项目的存储库
文件大小:1KB
文件格式:ZIP
更新时间:2024-05-01 18:36:11
ML模型使用来自各种来源的数据来预测申请人的违约概率,例如信贷局,先前的贷款申请,先前的贷款表现,先前的信用卡表现,分期付款和当前申请。 该项目的数据来自Kaggle举办的竞赛。 当前,该项目包括以下部分: 第1部分:导入原始训练数据集,聚集特征创建并将这些特征映射到Trainign数据上第2部分:有关具有映射特征,基线模型(逻辑回归)和调整模型性能(通过特征工程和特征选择)的训练数据的EDA 第3部分(进行中):尝试整合算法,以查看它是否进一步改善了模型性能 结果与结果: 当前最佳模型=> Logistic回归,火车上的ROC为0.7486,Kaggle得分为0.7351(在测试中)
【文件预览】:
Data_Science_Portfolio-master
----_config.yml(70B)
----README.md(1KB)