文件名称:DEND_Redshift_Data_Warehousing:使用SQL和Python在Amazon Redshift中进行数据仓库
文件大小:4KB
文件格式:ZIP
更新时间:2024-04-03 19:41:10
Python
适用于Udacity数据工程师Nanodegree的Amazon Redshift项目进行数据仓库 项目概况 这是Udacity数据工程师Nanodegree的数据仓库项目。 在这个项目中,我创建了一个ETL管道,该管道使用Amazon Redshift作为登台机制从Amazon S3提取数据并将其加载到数据库架构中。 该JSON文件表示由虚构的初创公司Sparkify的音乐流应用收集的用户活动日志。 结果数据库将用于分析目的。 Python脚本 create_tables.py :删除先前的架构并创建空表 sql_queries.py :定义ETL管道中使用的所有查询 etl.py :将数据从JSON文件加载到表中 数据库架构 事实表: songplays:日志文件中的歌曲播放记录 尺寸表: 歌手:音乐数据库中的歌手 歌曲:音乐数据库中的歌曲 用户:应用程序的用户 时间:记录的时间戳
【文件预览】:
DEND_Redshift_Data_Warehousing-main
----create_tables.py(671B)
----dwh.cfg(277B)
----etl.py(691B)
----sql_queries.py(5KB)
----README.md(1KB)