LendingClub:建立管道

时间:2021-04-15 02:29:48
【文件属性】:
文件名称:LendingClub:建立管道
文件大小:343KB
文件格式:ZIP
更新时间:2021-04-15 02:29:48
JupyterNotebook 借贷俱乐部 目录 概述 LendingClub是世界上最大的点对点贷款平台,投资者在这里为潜在的借款人提供资金,而投资者则从中获利。 该项目包括两个部分: 1.第一部分是分析2007年至2015年的贷款俱乐部数据集。我正在尝试探索这些数据,并从业务洞察力和风险的角度寻找有价值的信息。 2第二部分是建立一个pipleline来以有效的方式摄取和处理数据。 遵循管道,我首先从提供给AWS S3的数据源中提取总大小为1.1G的数据集。 清理并验证Python3中的数据集,然后将数据集保存在S3中。 目录结构根据以下树进行映射: Lendingclub |- data_pipeline.png |- README.md |- loan_analysis.ipynb |- src |- run.sh |- write_clean
【文件预览】:
LendingClub-master
----src()
--------.ignore(1B)
--------config.ini(583B)
--------data_cleaning.py(3KB)
--------write_clean_df.py(3KB)
----README.md(5KB)
----Visualization()
--------visualization1.jpg(185KB)
--------example(1B)
--------visualization2.jpg(62KB)
----data_pipeline.png(36KB)
----loan_analysis.ipynb(298KB)

网友评论