udacity-DEND-Data-Modelling-With-Apache-Cassandra

时间:2024-04-20 17:08:17
【文件属性】:

文件名称:udacity-DEND-Data-Modelling-With-Apache-Cassandra

文件大小:1.33MB

文件格式:ZIP

更新时间:2024-04-20 17:08:17

JupyterNotebook

项目:使用Cassandra进行数据建模 一家名为Sparkify的初创公司希望分析他们在新音乐流应用程序上收集的有关歌曲和用户活动的数据。 分析团队对了解用户正在收听的歌曲特别感兴趣。 当前,没有简单的方法来查询数据以生成结果,因为数据位于应用程序上用户活动的CSV文件目录中。 他们希望数据工程师创建一个Apache Cassandra数据库,该数据库可以对歌曲播放数据进行查询以回答问题,并希望带您进入该项目。 您的角色是为该分析创建数据库。 您将能够运行Sparkify分析团队提供给您的查询来创建结果,从而测试您的数据库。 项目概述在这个项目中,您将应用在Apache Cassandra上进行数据建模所学的知识,并使用Python来完成ETL管道。 要完成该项目,您将需要通过在Apache Cassandra中创建表来运行查询来对数据进行建模。 您将获得ETL管道的一部分,该管道可


【文件预览】:
udacity-DEND-Data-Modelling-With-Apache-Cassandra-master
----home()
--------Project_1B_ Project_Template.ipynb(20KB)
--------event_datafile_new.csv(827KB)
--------.ipynb_checkpoints()
--------event_data()
--------images()
----.workspace-submit.json(70B)
----README.md(2KB)

网友评论