SparkifyRedshift:在AWS上创建的数据仓库

时间:2024-05-03 05:42:42
【文件属性】:

文件名称:SparkifyRedshift:在AWS上创建的数据仓库

文件大小:209KB

文件格式:ZIP

更新时间:2024-05-03 05:42:42

Python

Sparkify Redshift 描述 该项目包含使用Amazon Redshift创建数据仓库的文件,Amazon Redshift是基于PostgreSQL列式数据库。 源数据来自Amazon S3存储桶。 这些文件如下所示: 歌曲数据集:第一个数据集是“集”中真实数据的子。 每个文件均为JSON格式,并包含有关歌曲和该歌曲的歌手的元数据。 这些文件按每首歌曲的曲目ID的前三个字母进行分区。 每个JSON文件看起来像。 { "num_songs": 1, "artist_id": "ARJIE2Y1187B994AB7" "artist_latitude": null, "artist_longitude": null, "artist_location": "", "artist_name": "Line Renaud",


【文件预览】:
SparkifyRedshift-main
----log-data.png(118KB)
----db-model.png(64KB)
----etl.py(1013B)
----README.md(3KB)
----dbeaver-conn.png(42KB)
----dwh.cfg(295B)
----sql_queries.py(6KB)
----create_tables.py(963B)

网友评论