文件名称:Sparkfy_NoSQL:ETL项目为Udemy课程建模Apache Cassandra
文件大小:603KB
文件格式:ZIP
更新时间:2024-04-23 22:44:16
JupyterNotebook
Sparkfy_NoSQL 一家名为Sparkify的初创公司希望分析他们在新音乐流应用程序上收集的有关歌曲和用户活动的数据。 分析团队对了解用户正在收听的歌曲特别感兴趣。 当前,没有简单的方法来查询数据以生成结果,因为有关应用程序上用户活动的数据位于CSV文件目录中。 他们希望数据工程师创建一个Apache Cassandra数据库,该数据库可以对歌曲播放数据进行查询以回答问题,并希望带您进入该项目。 您的角色是为该分析创建数据库。
【文件预览】:
Sparkfy_NoSQL-main
----.ipynb_checkpoints()
--------Project_1B_ Project_Template-checkpoint.ipynb(17KB)
----images()
--------image_event_datafile_new.jpg(360KB)
----event_data()
--------2018-11-05-events.csv(59KB)
--------2018-11-07-events.csv(29KB)
--------2018-11-12-events.csv(31KB)
--------2018-11-04-events.csv(26KB)
--------2018-11-03-events.csv(16KB)
--------2018-11-21-events.csv(75KB)
--------2018-11-27-events.csv(44KB)
--------2018-11-29-events.csv(53KB)
--------2018-11-19-events.csv(47KB)
--------2018-11-30-events.csv(57KB)
--------2018-11-14-events.csv(66KB)
--------2018-11-18-events.csv(24KB)
--------2018-11-15-events.csv(79KB)
--------2018-11-01-events.csv(2KB)
--------2018-11-22-events.csv(14KB)
--------2018-11-28-events.csv(62KB)
--------2018-11-24-events.csv(53KB)
--------2018-11-02-events.csv(25KB)
--------2018-11-25-events.csv(8KB)
--------2018-11-17-events.csv(21KB)
--------2018-11-13-events.csv(57KB)
--------2018-11-23-events.csv(42KB)
--------2018-11-10-events.csv(14KB)
--------2018-11-09-events.csv(41KB)
--------2018-11-26-events.csv(39KB)
--------2018-11-06-events.csv(26KB)
--------2018-11-20-events.csv(54KB)
--------2018-11-08-events.csv(30KB)
--------2018-11-11-events.csv(14KB)
--------2018-11-16-events.csv(54KB)
----Project_1B_ Project_Template.ipynb(17KB)
----README.md(632B)
----.gitignore(2KB)