Data-Modeling-with-Postgres

时间:2024-05-09 06:33:37
【文件属性】:

文件名称:Data-Modeling-with-Postgres

文件大小:58KB

文件格式:ZIP

更新时间:2024-05-09 06:33:37

JupyterNotebook

使用Postgres进行数据建模 在这个项目中,我担任数据工程师的角色,为虚构的初创公司Sparkify创建数据库架构和ETL管道。 数据库模式是在Postgres数据库上创建的,用于对歌曲播放进行最佳查询。 项目任务涉及为星型架构设计事实和维度表,以及开发Python和SQL脚本以创建ETL管道,该管道将数据从两个本地目录中的文件传输到Postgres中的表中。 目录 歌曲播放分析架构 使用歌曲和日志数据集,根据以下实体关系图创建了针对查询歌曲播放分析而优化的星型模式: 数据和代码 该项目包含两个数据集,第一个数据集是集中真实数据的子。 每个文件均为JSON格式,并包含有关歌曲和该歌曲的歌手的元数据。 第二个数据集由根据第一个数据集中的歌曲生成的JSON格式的日志文件组成。 日志文件根据指定的配置模拟来自音乐流应用程序的活动日志。 除数据文件外,项目工作区还包括六个文件: test.


【文件预览】:
Data-Modeling-with-Postgres-main
----test.ipynb(18KB)
----etl.py(4KB)
----songplays_erd.PNG(51KB)
----README.md(2KB)
----sql_queries.py(3KB)
----etl.ipynb(34KB)
----create_tables.py(2KB)

网友评论