文件名称:ECE4150_Project
文件大小:9KB
文件格式:ZIP
更新时间:2024-04-25 03:58:45
Python
ECE4150_Project 1.项目可以在2021年4月24日之前提交。 2.Project包含您的作品的文字和视频 3.您可以根据需要在团队中工作,选择权取决于您。 显然,对于下面的第(4)项,团队预计将为单个人提供更多的资金。 4.本文大约有10页。 项目范围及分级大纲 1.在本地计算机上安装Spark。 等级贡献10% 2.实施简单的分析程序,例如“超级英雄”或“电影受欢迎度”或“单词计数”(请参阅20世纪视频讲座笔记-2021年3月31日),并显示结果-GradeContribution-15% 3.将Spark移至Amazon AWS EC2并执行与(2)中相同的分析任务,并将结果存储在NoSQL数据库中。 等级贡献40% 4,在AWS上使用Spark编写另一个分析程序,然后在(2)或一组新的现有数据集中运行它,然后运行它。 成绩贡献率30%-在查找备用数据
【文件预览】:
ECE4150_Project-main
----.gitignore(9B)
----datasets()
--------allens_notes(107B)
--------potential_datasets.txt(287B)
----jupyter_predefined_config.py(21KB)
----README.md(1KB)
----cleanup.sh(79B)
----setup.sh(1021B)