文件名称:使用Apache-Cassandra进行数据建模:使用Apache Cassandra进行数据建模
文件大小:1KB
文件格式:ZIP
更新时间:2024-03-07 21:00:51
介绍 一家名为Sparkify的初创公司希望分析他们在新音乐流应用程序上收集的有关歌曲和用户活动的数据。 分析团队对了解用户正在收听的歌曲特别感兴趣。 当前,他们没有一种简单的方法来查询数据,该数据位于应用程序上有关用户活动的JSON日志目录中,以及位于应用程序中的歌曲上的具有JSON元数据的目录中。 创建后,数据库将为Sparkify提供分析和从他们收集的歌曲和用户活动数据中获取更多见解的功能。 该项目包含事件csv日志文件和Jupyter笔记本脚本。 要将文件加载到表中,请按照以下步骤操作。 项目文件 event_data-该文件夹包含事件csv日志文件。 Project_1B_Project_Template.ipynb-从song_data和log_data读取并处理单个文件,并将数据加载到我们的表中。 etl.py-从song_data和log_data读取并处理单个文件,
【文件预览】:
Data-modelling-with-Apache-Cassandra-main
----event_data()
--------2018-11-01-events.csv(1B)
----README.md(1KB)