文件名称:DataModelingUdacity:Trabalho光纤数据建模Udacity-当前数据工程
文件大小:59KB
文件格式:ZIP
更新时间:2024-03-28 02:38:34
JupyterNotebook
•••• 关于 一家名为Sparkify的初创公司希望分析他们在新音乐流应用程序上收集的有关歌曲和用户活动的数据。 分析团队对了解用户正在收听的歌曲特别感兴趣。 在该项目中,基于事实表和四个维度创建了一个星型模型,以分析用户正在收听哪些歌曲的信息。 苏玛莉 该项目具有以下文件 test.ipynb->显示每个表的前几行,以便您检查数据库。 create_tables.py->删除并创建表。 每次运行ETL脚本之前,您都运行此文件以重置表。 etl.ipynb->从song_data和log_data读取并处理单个文件,并将数据加载到表中。 本笔记本包含有关每个表的ETL流程的详细说明。 etl.py->从song_data和log_data中读取和处理文件,并将它们加载到表中。 您可以根据自己在ETL笔记本中的工作来填写。 sql_queries.py->包含所有sql查询,并导入
【文件预览】:
DataModelingUdacity-main
----principal.ipynb(5KB)
----test.ipynb(17KB)
----etl.py(3KB)
----README.md(11KB)
----ER Diagram.jpeg(63KB)
----sql_queries.py(3KB)
----etl.ipynb(44KB)
----create_tables.py(2KB)