文件名称:data-modeling-with-postgres
文件大小:474KB
文件格式:ZIP
更新时间:2024-04-25 07:21:26
JupyterNotebook
使用Pogres进行数据建模 介绍 一家名为Sparkify的初创公司希望分析他们在新音乐流应用程序上收集的有关歌曲和用户活动的数据。 分析团队对了解用户正在收听的歌曲特别感兴趣。 当前,他们没有一种简单的方法来查询数据,该数据位于应用程序上有关用户活动的JSON日志目录中,以及位于应用程序中的歌曲上的具有JSON元数据的目录中。 他们希望数据工程师使用表来创建Postgres数据库,该表旨在优化歌曲播放分析的查询,并带您进入项目。 您的角色是为该分析创建数据库架构和ETL管道。 通过运行Sparkify分析团队提供给您的查询并将您的结果与预期结果进行比较,您将能够测试数据库和ETL管道。 概述 在这个项目中,我们将使用来自在线歌曲流服务的非结构化数据事件,并将其转换为结构化的关系数据模型。 这个想法是建立一个发布数据模型,用户应该能够请求组合不同组合的数据。 目的 该项目的目的是根据分