机器学习:该项目使用来自Lending Club的免费数据来构建和评估几种机器学习模型,以预测信用风险。 我们采用了不同的技术来训练和评估班级不平衡的模型。 使用不平衡学习和Scikit学习库

时间:2024-03-01 13:37:21
【文件属性】:

文件名称:机器学习:该项目使用来自Lending Club的免费数据来构建和评估几种机器学习模型,以预测信用风险。 我们采用了不同的技术来训练和评估班级不平衡的模型。 使用不平衡学习和Scikit学习库

文件大小:16KB

文件格式:ZIP

更新时间:2024-03-01 13:37:21

JupyterNotebook

机器学习 该练习包括一方面使用不同的重采样技术来分析信用风险,另一方面使用集成技术来分析信用风险。 在第一部分中,我们将使用过采样,欠采样以及组合的(过高和不足)采样技术来查看哪种模型在预测信用风险方面做得更好。 在第二部分中,我们将使用不同的集成技术进行相同的操作,以查看哪种模型在预测信用风险方面也做得更好。 分析记录位于ipynb文件中。 重采样技术: 哪种型号的平衡准确度得分最高? 在本练习中,我们使用了4个模型:朴素的随机过采样,SMOTE过采样,欠采样和组合(上下采样)采样。 SMOTE过采样模型产生的最佳平衡精度得分为0.8388510243681058,紧随其后的是组合采样(上下采样)为0.8388319216626994,而朴素的随机过采样率为0.8325468421491353。 欠采样模型位于0.8215575767118339处,但是必须注意,所有平衡精


【文件预览】:
Machine-Learning-master
----credit_risk_resampling.ipynb(43KB)
----credit_risk_ensemble.ipynb(41KB)
----README.md(3KB)

网友评论