ETL-Project

时间:2024-03-29 03:50:03
【文件属性】:

文件名称:ETL-Project

文件大小:26.26MB

文件格式:ZIP

更新时间:2024-03-29 03:50:03

JupyterNotebook

ETL项目 该项目旨在根据大墨尔本地区内的地点类型,对所犯罪行与郊区概况之间的关系(如有)进行探索性数据分析。 数据探讨犯罪类型和每年的平均发生频率,以及场所类型,包括酒类商店,警察局和公园。 (平均值基于记录的2011年至2020年的频率)。 利用Extract-Transform-Load(ETL)流程可有效地整理原始数据集,以从各种来源进行分析(提取),并对每个数据集进行大量转换,以便将其作为关系数据库加载到SQL中。 转换将数据“清理”为规范化且一致的格式,以允许导入到SQL中,并随后允许任何用户执行适合自己需求的各种联接分析。 有关提取,转换和加载数据集的完整详细信息,请参阅存储库中包含的ETL项目报告。 项目团队 汤姆·皮德尔斯登(Tom Peddlesden) Heesu Ha 朱伟兰 杰森·萨顿(Jason Sutton) 状态 项目完成 运行Jupyter


【文件预览】:
ETL-Project-main
----.gitignore(2KB)
----000_Resources()
--------Aust Postcode Location()
--------Crime rate()
--------.DS_Store(6KB)
--------LGA(councils)_postcode(POA)()
----002_Extract_Transform_Google_Places()
--------.gitignore(2KB)
--------01_melb_no_types.ipynb(58KB)
--------04_suburb_place_types_output_for_sql.ipynb(50KB)
--------.DS_Store(6KB)
--------03_places_types_output_for_sql.ipynb(14KB)
--------02_check_api_data.ipynb(196KB)
--------01_Outputs()
----.DS_Store(14KB)
----005_Load_SQL()
--------.gitignore(2KB)
--------ETL_Schema.sql(4KB)
--------01_load_SQL.ipynb(47KB)
--------01_Inputs()
--------.DS_Store(6KB)
--------02_Entity Relationship Digram()
----README.md(3KB)
----004_Extract_Teansform_LGA_Suburb()
--------01_creating_tables_for_sql_heesu_2_times_Output.ipynb(16KB)
----001_Extract_Transform_Suburbs()
--------03_output_suburbs_postcodes_for_sql.ipynb(10KB)
--------02_Obtaining postcodes for final suburb list.ipynb(41KB)
--------.DS_Store(6KB)
--------01_Outputs()
--------01_scraping_melbourne_suburbs_heesu.ipynb(346KB)
----003_Extract_Transform_Crime_Data()
--------Crime - Transformation 1 - filtering out irrelevant data.ipynb(111KB)
--------Crime - Transformation 3 - exploratory data analysis.ipynb(119KB)
--------.DS_Store(8KB)
--------Crime - Transformation 2 - Data Clean.ipynb(40KB)
--------01_Outputs()
----ETL Report - Project 2 - Monash University Data Analytics Bootcamp.pdf(590KB)

网友评论

相关文章