【文件属性】:
文件名称:Credit_Risk_Analysis
文件大小:19.85MB
文件格式:ZIP
更新时间:2021-02-10 04:31:46
JupyterNotebook
监督机器学习和信用风险分析
分析概述
该分析的目的是使用机器学习算法预测信用风险。 在整个分析过程中,都评估了机器学习模型的优缺点。
使用RandomOverSampler和SMOTE算法对数据进行过采样。
使用ClusterCentroids算法对数据进行欠采样。
SMOTEEN算法用于过采样和欠采样的组合方法。
利用BalancedRandomForestClassifier和EasyEnsembleClassifier来预测信用风险。
结果
天真的随机过采样结果:
平衡准确度得分为66%,较低。
高风险的精度为1%,表示阳性率较低。 召回率是66%。
SMOTE过采样结果:
平衡精度得分约为63%,被认为是低的。
high_risk的精度为1%,表示阳性率低。 召回率为61%。
欠采样ClusterCentroids结果:
-平衡准确率得分为52%,较低。 -低风险
【文件预览】:
Credit_Risk_Analysis-main
----Module-17-Challenge-Resources()
--------credit_risk_resampling.ipynb(41KB)
--------credit_risk_ensemble.ipynb(37KB)
--------LoanStats_2019Q1.csv(88.99MB)
----naive_random.png(193KB)
----oversampling.png(160KB)
----undersampling.png(212KB)
----README.md(2KB)
----random_forest.png(258KB)
----easy_ensemble.png(160KB)
----combination.png(179KB)