文件名称:metis-project3
文件大小:19.85MB
文件格式:ZIP
更新时间:2024-03-03 04:04:37
JupyterNotebook
Metis数据科学训练营| 项目3 预测贷款人关于房屋贷款再融资申请的决定 分类分析 项目时间表:三周 最终演讲在发布。 介绍 全美房地产经纪人协会(National Association of Realtors)预期利率在2020年仍将保持在较低水平。迄今为止,抵押贷款利率已接近创纪录的低点,这表明经济仍在继续挣扎。 这种利率环境对那些寻求再融资以减轻财务负担的人来说是有利的。 因此,最好尽快申请再融资以确保较低的利率。 理解贷方着重于制定决策的财务特征以及这些特征如何在批准或拒绝申请中发挥作用是有益的。 该项目使用机器学习方法解决了这些问题。 首先,该数据是从《房屋抵押信息披露法》(HMDA)查询网站收集的。 其次,在初始数据清除后,使用5倍交叉验证的随机森林模型进行特征选择,以识别重要的财务特征。 完成此步骤后,将使用所有训练数据以及所选特征来训练随机森林模型。 由于随机森林模型
【文件预览】:
metis-project3-main
----presentation()
--------presentation_project3.pdf(806KB)
----figures()
--------workflow.png(23KB)
--------barplot_tnr_tpr.svg(54KB)
--------feature_selection.png(39KB)
--------cf_mat_voting.svg(52KB)
--------hoepa_status_count.svg(26KB)
--------feat_sel_permut_importance.svg(76KB)
--------confusion_matrices.png(148KB)
--------rel_feat_importance_logreg.svg(71KB)
--------cf_mat_voting.png(105KB)
--------data_summary.png(106KB)
--------cf_mat_logreg.svg(52KB)
--------roc_curve.svg(50KB)
--------cf_mat_rf.svg(52KB)
----sql_setup()
--------sql_db_setup.sql(4KB)
----src()
--------data_cleaning.py(11KB)
--------util.py(18KB)
--------EDA.ipynb(1010KB)
--------feature_selection.ipynb(124KB)
--------classifier_modeling.ipynb(313KB)
----README.md(8KB)
----data()
--------rf_pipeline.pickle(47.23MB)
--------HMDA_Documentation.pdf(2.9MB)
--------idx_sel_feat_permu_importance.pickle(203B)
--------data_vf.pickle(12.48MB)
--------HMDA_data_query_all_banks.pdf(242KB)
--------actions_taken_1-2-3_all_banks_loan_purposes_31_state_ma.csv(29.91MB)