文件名称:data_modelling_with_apache_cassandra
文件大小:1.11MB
文件格式:ZIP
更新时间:2024-04-04 09:18:47
JupyterNotebook
使用Apache Cassandra激发数据建模的案例研究 概括 该项目旨在帮助Sparkify音乐创业公司在Apache Cassandra中建立数据库以查询其数据。 到目前为止,它们的数据位于应用程序上用户活动的CSV文件目录中。 此存储库中的代码是按会话,用户会话和用户播放的歌曲到数据库中的音乐表的ETL。 指示 将用户活动文件加载到event_data。 运行Project_1B_ Project_Template.ipynb以提取,转换并加载到Apache Cassandra中。 回购结构 event_data :包含应用程序中的用户活动,即CSV文件。 images :图片。 Project_1B_ Project_Template.ipynb :带有用于构建ETL流程的所有代码的笔记本。 它创建以下表格: music_by_session user_session
【文件预览】:
data_modelling_with_apache_cassandra-main
----Project_1B_ Project_Template.ipynb(23KB)
----event_datafile_new.csv(834KB)
----images()
--------.ipynb_checkpoints()
--------image_event_datafile_new.jpg(360KB)
----event_data()
--------2018-11-09-events.csv(41KB)
--------2018-11-05-events.csv(59KB)
--------2018-11-27-events.csv(44KB)
--------2018-11-14-events.csv(66KB)
--------2018-11-02-events.csv(25KB)
--------2018-11-12-events.csv(31KB)
--------2018-11-08-events.csv(30KB)
--------2018-11-01-events.csv(2KB)
--------2018-11-11-events.csv(14KB)
--------2018-11-20-events.csv(54KB)
--------2018-11-19-events.csv(47KB)
--------2018-11-03-events.csv(16KB)
--------2018-11-07-events.csv(29KB)
--------2018-11-29-events.csv(53KB)
--------2018-11-04-events.csv(26KB)
--------2018-11-22-events.csv(14KB)
--------2018-11-13-events.csv(57KB)
--------2018-11-18-events.csv(24KB)
--------2018-11-25-events.csv(8KB)
--------2018-11-30-events.csv(57KB)
--------2018-11-10-events.csv(14KB)
--------2018-11-26-events.csv(39KB)
--------2018-11-16-events.csv(54KB)
--------2018-11-17-events.csv(21KB)
--------2018-11-15-events.csv(79KB)
--------2018-11-23-events.csv(42KB)
--------2018-11-06-events.csv(26KB)
--------2018-11-24-events.csv(53KB)
--------2018-11-28-events.csv(62KB)
--------2018-11-21-events.csv(75KB)
----README.md(860B)