文件名称:Projects-Udacity-Data-Engineering-Nanodegree:该存储库包含Udacity在整个数据工程纳米学位中开发的所有项目
文件大小:3.85MB
文件格式:ZIP
更新时间:2024-04-18 00:32:11
JupyterNotebook
数据工程项目 ! ´ 该存储库包含Udacity在整个数据工程纳米学位中开发的所有项目。 使用Postgres(SQL)进行数据建模 该项目模拟了一个名为Sparkify的Startup音乐流,将关系数据库和数据建模的知识融合在一起,以便使用python开发一个ETL管道。 该项目的目标是创建一个Postgres数据库,其中包含旨在优化歌曲播放分析查询的表。 这里使用了诸如OLAP和Fact and Dimension Tables以及Star Schema之类的概念,以创建高效的ETL管道,该管道仅需几个命令即可运行必要的查询,以从JSON文件生成数据库。 在项目结束时,将创建一个包含用于倍数分析任务的数据的数据库,该数据库可用于任何想使用它的人。 链接:使用 使用Apache Cassandra(NoSQL)进行数据建模 该项目模拟了一个名为Sparkify的启动音乐流,将NoSQ