【文件属性】:
文件名称:cassandra-data-modeling:Udacity数据工程师Nanodegree-Postgres数据建模
文件大小:605KB
文件格式:ZIP
更新时间:2021-02-04 15:45:35
docker cassandra etl nosql data-modeling
卡桑德拉数据建模
Udacity数据工程师纳米学位项目
一家名为Sparkify的初创公司希望分析他们在新音乐流应用程序上收集的有关歌曲和用户活动的数据。 分析团队对了解用户正在收听的歌曲特别感兴趣。 当前,没有简单的方法来查询数据以生成结果,因为有关应用程序上用户活动的数据位于CSV文件目录中。
他们希望数据工程师创建一个Apache Cassandra数据库,该数据库可以对歌曲播放数据创建查询以回答问题。 任务是为该分析创建一个Cassandra数据库。
在本地运行的要求
Python3
码头工人
Docker组合
项目结构说明
postgres-data-modeling
│ R
【文件预览】:
cassandra-data-modeling-master
----images()
--------image_event_datafile_new.jpg(360KB)
----src()
--------scripts()
--------notebooks()
----event_data()
--------2018-11-12-events.csv(31KB)
--------2018-11-10-events.csv(14KB)
--------2018-11-02-events.csv(25KB)
--------2018-11-13-events.csv(57KB)
--------2018-11-30-events.csv(57KB)
--------2018-11-07-events.csv(29KB)
--------2018-11-21-events.csv(75KB)
--------2018-11-19-events.csv(47KB)
--------2018-11-18-events.csv(24KB)
--------2018-11-20-events.csv(54KB)
--------2018-11-16-events.csv(54KB)
--------2018-11-28-events.csv(62KB)
--------2018-11-11-events.csv(14KB)
--------2018-11-29-events.csv(53KB)
--------2018-11-15-events.csv(79KB)
--------2018-11-09-events.csv(41KB)
--------2018-11-06-events.csv(26KB)
--------2018-11-24-events.csv(53KB)
--------2018-11-03-events.csv(16KB)
--------2018-11-27-events.csv(44KB)
--------2018-11-04-events.csv(26KB)
--------2018-11-25-events.csv(8KB)
--------2018-11-22-events.csv(14KB)
--------2018-11-23-events.csv(42KB)
--------2018-11-26-events.csv(39KB)
--------2018-11-17-events.csv(21KB)
--------2018-11-01-events.csv(2KB)
--------2018-11-14-events.csv(66KB)
--------2018-11-05-events.csv(59KB)
--------2018-11-08-events.csv(30KB)
----requirements.txt(31B)
----docker-compose.yml(183B)
----.gitignore(222B)
----README.md(3KB)