文件名称:Data-Engenieer:纳米度-Udacity
文件大小:33.22MB
文件格式:ZIP
更新时间:2024-05-01 00:31:20
JupyterNotebook
该存储库包含Udacity的数据工程课程项目。 项目1:使用Postgres进行数据建模 项目2:使用Casandra进行数据建模 项目3:云数据仓库 项目4:带有Spark的Data Lake 项目5:具有气流的数据管道 项目6:最终项目
【文件预览】:
Data-Engenieer-main
----Data Warehouse()
--------fact_table.png(105KB)
--------log-data.png(118KB)
--------make_connection_cluster.ipynb(12KB)
--------etl.py(2KB)
--------Readme.md(3KB)
--------sql_queries.py(7KB)
--------config.cfg(391B)
----Clustering AGGLOMERATIVE with BERT.ipynb(42KB)
----Data Modeling with Apache Cassandra()
--------cql_queries.py(2KB)
--------Project_1B_ Project_Template.ipynb(20KB)
--------event_datafile_new.csv(834KB)
--------event_data_file_new.csv(834KB)
--------etl.py(5KB)
--------Readme.md(2KB)
--------dataprep.py(3KB)
----Final Project()
--------utils.py(1KB)
--------data()
--------pics()
--------etl.py(13KB)
--------Capstone Project Template.ipynb(94KB)
--------README.md(4KB)
----Data Lake with Spark()
--------dl.cfg(60B)
--------etl.py(4KB)
--------Readme.md(3KB)
--------queries.py(2KB)
----Data Modeling with Postgres()
--------song_plays.png(67KB)
--------etl.py(4KB)
--------Readme.md(2KB)
--------test.ipynb(16KB)
--------etl.ipynb(32KB)
--------sql_queries.py(3KB)
--------requirements.txt(24B)
----Data Pipelines with Airflow()
--------log-data.png(118KB)
--------Readme.md(2KB)
--------airflow()
--------example-dag.png(109KB)
----README.md(309B)