文件名称:udacity-data-engineering-nanodegree:Github资源库,用于项目上传
文件大小:576KB
文件格式:ZIP
更新时间:2024-04-04 04:05:43
JupyterNotebook
数据工程纳米课程 这GitHub的库是为完成所有完成所需要的项目取得Udacitiy课程。 储存库结构 在仓库中,每个目录代表一个项目(项目按提交时间排序)。 每个目录都有其自述文件,因此请随时检查它们 该项目提供了一个很好的示例,说明了如何使用和psycopg2作为数据库适配器在Postgresql中构建,填充和测试关系数据库(DB)。 在这个项目中,我们使用作为项目的数据源从SQL迁移到NoSQL。 它是使用, cassandra作为DB适配器和CQL作为python之外的编程语言开发的。
【文件预览】:
udacity-data-engineering-nanodegree-master
----Data Modeling with Apache Cassandra()
--------Project_1B_ Project_Template.ipynb(23KB)
--------event_datafile_new.csv(834KB)
--------README.md(650B)
----Data Lake with Spark()
--------data_lake_final_tables.png(77KB)
--------etl.py(7KB)
--------output.txt(3KB)
--------.gitignore(6B)
--------README.md(2KB)
--------data_lake_source_tables.png(26KB)
----Data Modeling with Postgres()
--------db_schema.png(87KB)
--------create_tables.py(2KB)
--------etl.py(4KB)
--------test.ipynb(13KB)
--------etl.ipynb(156KB)
--------sql_queries.py(3KB)
--------README.md(7KB)
----Data Pipelines with Airflow()
--------airflow()
--------Variables(78B)
--------Connections(36B)
----README.md(1KB)
----AWS Data Warehouse()
--------create_tables.py(1KB)
--------Process_&_analytics.ipynb(5KB)
--------staging_tables_AWS.png(26KB)
--------etl.py(1KB)
--------final_tables_AWS.png(77KB)
--------sql_queries.py(6KB)
--------.gitignore(7B)
--------README.md(2KB)