【文件属性】:
文件名称:数据工程项目
文件大小:31KB
文件格式:ZIP
更新时间:2021-02-09 14:34:44
JupyterNotebook
数据工程CapstoneProject
项目总结:
该项目旨在通过使用Pyspark建立一个数据湖来回答有关美国移民的问题,例如哪些国家是最受欢迎的移民城市,该湖可以通过从所有来源提取数据来帮助支持分析。
数据集:
【文件预览】:
Data-Engineering-CapstoneProject-main
----README.md(484B)
----I94_SAS_Labels_Descriptions.SAS(34KB)
----Capstone Project Template.ipynb(165KB)