文件名称:Data-Modeling-with-Postgres
文件大小:4KB
文件格式:ZIP
更新时间:2024-05-01 07:54:32
Python
介绍 一家名为Sparkify的初创公司希望分析他们在新音乐流应用程序上收集的有关歌曲和用户活动的数据。 分析团队对了解用户正在收听的歌曲特别感兴趣。 我需要创建表以使用查询来检索数据 项目介绍 在这个项目中,我将使用Postgres进行数据建模,并使用Python构建ETL管道。 为了完成项目,我将需要为特定分析重点的星型模式定义事实和维度表,并编写ETL管道,该管道使用Python和SQL将数据从两个本地目录中的文件传输到Postgres中的这些表中。 档案文件 create_tables.py删除并创建表。 每次您运行ETL脚本之前,我们都会运行此文件来重置您的表。 etl.py从song_data和log_data中读取和处理文件,并将它们加载到表中。 sql_queries.py包含所有SQL查询,并导入到create_tables.py和etl.py文件中。 施玛 事实表
【文件预览】:
Data-Modeling-with-Postgres-master
----etl.py(3KB)
----README.md(2KB)
----sql_queries.py(2KB)
----create_tables.py(2KB)