文件名称:ETL_FOR_INSERT_DATA
文件大小:7KB
文件格式:ZIP
更新时间:2024-03-18 07:31:47
ETL_FOR_INSERT_DATA 介绍 一家名为Sparkify的初创公司希望分析他们在新音乐流应用程序上收集的有关歌曲和用户活动的数据。 分析团队对了解用户正在收听的歌曲特别感兴趣。 目的是创建一个Postgres数据库架构和ETL管道来优化歌曲播放分析的查询。 项目描述 在这个项目中,我必须使用Postgres建模数据,并使用Python构建和ETL管道。 在数据库方面,我必须为“星型模式”定义事实和维度表以得到特定的关注。 另一方面,ETL管道将使用Python和SQL将位于两个本地目录中的文件中的数据传输到Postgres中的这些表中 歌曲播放分析架构 事实表 在歌曲播放相关的日志数据songplays记录 尺寸表 应用中的用户 音乐数据库中的歌曲 音乐数据库中的艺术家 时间:歌曲播放记录的时间戳分为特定单位 项目设计 数据库设计是非常优化的,因为只有少量的表并进行特定
【文件预览】:
ETL_FOR_INSERT_DATA-main
----Data_Modeling()
--------create_tables.py.ipynb(3KB)
--------ETL_ESP.ipynb(13KB)
--------sql_queries.py(3KB)
----README.md(2KB)