文件名称:ETL挑战:ETL项目
文件大小:23.85MB
文件格式:ZIP
更新时间:2024-03-10 18:05:24
JupyterNotebook
ETL挑战 <<<<<<< HEAD此ETL项目包含两个数据集,其中一个来自 ,其中包括NYPD投诉-data和其他数据来自 ,其中包含美国邮政编码的纬度和经度。 我们决定使用两个月(七月和十二月)和两年(2019、2020年)。 我们选择7月和12月作为我们的月份,因为我们想使用夏季月份和冬季月份。 由于NYPD投诉数据未在其数据集中提供邮政编码,因此我们选择将美国邮政编码的纬度和经度内部结合起来,以将邮政编码映射到NYPD投诉。 通过将NYPD投诉数据上的纬度和经度数四舍五入,在加入美国邮政编码纬度和经度数据时,它给出了更为重要的结果。 此ETL项目包含两个数据集,一个来自 ,涉及NYPD-complaint-data,另一个来自 ,其中包含美国邮政编码的纬度和经度。 我们决定使用两个月(七月和十二月)和两年(2019、2020)。 我们选择7月和12月作为我们的月份,因为我们想使用
【文件预览】:
ETL-challenge-main
----.gitignore(2KB)
----README.md(2KB)
----nypd_crimes_db.sql(282B)
----Resources()
--------NYPD_Complaint_Data_2017.csv(36KB)
--------NYPD_2017.csv(5KB)
--------US-crime_zipcode_m.csv(1.6MB)
--------2020_NYPD_Complaint_Data.csv(54.6MB)
--------NYPD_Vechicle_Collision_2017.csv(3.08MB)
--------NYPD_NoNA_2020.csv(2.83MB)
--------us_zip_lat_long.csv(2.76MB)
--------US-crime_zipcode.csv(2MB)
--------2019_NYPD_Complaint_Data.csv(54.6MB)
--------NYVechicle_2017.csv(1.36MB)
----pandas_etl.ipynb(103KB)
----sharice()
--------NYPD2017.ipynb(180KB)
--------NYPD_Crime_2020.ipynb(85KB)
--------NYPD_Vechicle_Collision_2017.csv(3.08MB)
--------Untitled.ipynb(72B)