文件名称:Credit_Risk_Analysis
文件大小:19.85MB
文件格式:ZIP
更新时间:2024-03-01 22:18:26
JupyterNotebook
监督机器学习和信用风险分析 分析概述 该分析的目的是使用机器学习算法预测信用风险。 在整个分析过程中,都评估了机器学习模型的优缺点。 使用RandomOverSampler和SMOTE算法对数据进行过采样。 使用ClusterCentroids算法对数据进行欠采样。 SMOTEEN算法用于过采样和欠采样的组合方法。 利用BalancedRandomForestClassifier和EasyEnsembleClassifier来预测信用风险。 结果 天真的随机过采样结果: 平衡准确度得分为66%,较低。 高风险的精度为1%,表示阳性率较低。 召回率是66%。 SMOTE过采样结果: 平衡精度得分约为63%,被认为是低的。 high_risk的精度为1%,表示阳性率低。 召回率为61%。 欠采样ClusterCentroids结果: -平衡准确率得分为52%,较低。 -低风险
【文件预览】:
Credit_Risk_Analysis-main
----Module-17-Challenge-Resources()
--------credit_risk_resampling.ipynb(41KB)
--------credit_risk_ensemble.ipynb(37KB)
--------LoanStats_2019Q1.csv(88.99MB)
----naive_random.png(193KB)
----oversampling.png(160KB)
----undersampling.png(212KB)
----README.md(2KB)
----random_forest.png(258KB)
----easy_ensemble.png(160KB)
----combination.png(179KB)