文件名称:udacity-data-engineering-nanodegree:用于项目上传的Github存储库
文件大小:342KB
文件格式:ZIP
更新时间:2024-02-29 03:58:12
JupyterNotebook
数据工程纳米课程 这GitHub的库是为完成所有完成所需要的项目取得Udacitiy课程。 仓库结构 在仓库中,每个目录代表一个项目。 每个目录都有其自述文件,因此请不要犹豫检查它们(按项目提交时间排序) 该项目提供了一个很好的示例,说明了如何使用和psycopg2作为数据库适配器在Postgresql中构建,填充和测试关系数据库(DB)。 在这个项目中,我们使用作为项目的数据源从SQL迁移到NoSQL。 它是使用, cassandra作为DB适配器和CQL作为python之外的编程语言开发的。
【文件预览】:
udacity-data-engineering-nanodegree-master
----Data Modeling with Apache Cassandra()
--------Project_1B_ Project_Template.ipynb(23KB)
--------event_datafile_new.csv(834KB)
--------README.md(650B)
----Data Modeling with Postgres()
--------db_schema.png(87KB)
--------create_tables.py(2KB)
--------etl.py(4KB)
--------test.ipynb(13KB)
--------etl.ipynb(156KB)
--------sql_queries.py(3KB)
--------README.md(7KB)
----README.md(1KB)