文件名称:udacity-data-modeling:创建该项目的目的是为Sparkify提供基于PostgreSQL尺寸模型
文件大小:502KB
文件格式:ZIP
更新时间:2024-04-03 16:03:35
JupyterNotebook
使用Postgres进行数据建模 罗德里戈·科埃略(Rodrigo Coelho) 介绍 这是Udacity数据工程纳米学位的项目。 在此项目中,为Sparkify创建了一个数据库,该公司的目标是提高其分析能力 概括 应用所有ETL步骤以为Sparkify提供星型模式模型。 选择了启动模式,因为它是最易于分析的模型之一。 总而言之,数据是从JSON源提取的,使用Pandas DataFrame进行转换,然后加载到数据库中。 ETL过程中使用了两组数据。 歌曲和日志数据。 歌曲数据可提供歌曲和艺术家信息,而日志数据则更为广泛。 提供翻唱歌曲,歌手和每首歌的一些元数据。 日志数据范围更广,可提供艺术家和艺术家元数据。 档案文件 该项目是使用python语言和SQL来操作Postgres数据库的。 它包含以下文件: create_table.py-创建和删除所有表和数据库; sql_quer