文件名称:data-warehouse
文件大小:4KB
文件格式:ZIP
更新时间:2024-04-21 21:03:55
Python
数据仓库项目 文献资料 该存储库包含以下文件: create_tables.py(使用以下表格在Amazon redshift中创建一个sparkify数据库:歌曲播放,用户,歌曲,时间和艺术家。) etl.py(ETL进程通过登台表将数据从s3桶中提取到亚马逊红移。您可以找到该管道的图表。) sql_queries.py(包含用于创建,插入和删除表的所有查询,包括登台表的创建) 关于如何运行此过程 首先在python控制台中编写运行create_tables.py 。 这将在Amazon Redshift中创建必要的表,以成功执行该过程。 在python控制台中编写runetl.py 。 在此步骤中,数据取自s3,并存储在Amazon Redshift的登台表中。 然后,通过Amazon Redshift内部的查询,此数据将馈送到users表,songplay表,song表,歌手
【文件预览】:
data-warehouse-main
----sql_queries.py(5KB)
----README.md(3KB)
----etl.py(691B)
----create_tables.py(671B)