文件名称:java完整扑克源码-BigData_CS644:我在NJIT硕士课程CS644中完成的大数据作业和项目
文件大小:386KB
文件格式:ZIP
更新时间:2024-06-25 11:19:28
系统开源
java完整源码大数据_CS644 此存储库包含我在 NJIT 的大数据课程期间完成的所有作业和项目 作业 1:设置 AWS EC2 实例 按照以下步骤通过 AWS 设置 VM 实例以备后用: 创建 Amazon 帐户(如果您还没有): 作为学生申请免费积分: 使用您选择的任何 Linux AMI 创建并启动两个基本的 Amazon EC2 实例 分配适当的安全组(具有适当的防火墙设置)允许两个实例之间的网络流量在每个 VM 实例上为 ssh 服务器配置“authorized_keys”和为 ssh 客户端配置“known_hosts”,以允许它们之间进行无密码 ssh 登录 作业 2:在独立模式下配置 Hadoop 并开发一个 map-reduce Java 程序来查找丢失的扑克牌 在您在 HW2 中创建的 VM 实例之一中,执行以下操作: 以非分布式或本地模式(独立)下载、安装和运行最新版本的 Apache Hadoop: 在您的 Hadoop 系统中开发和测试基于 MapReduce 的方法,以找到所有丢失的扑克牌。 提交要求:一个包含以下内容的压缩文件: 包含随机数 (<52)
【文件预览】:
BigData_CS644-master
----AirlineOnTime.jar(6KB)
----AirlineOnTime_Output.txt(223B)
----AverageTaxiTime.jar(4KB)
----Workflow.xml(6KB)
----README.md(6KB)
----CancellationReason_Output.txt(44B)
----CancellationReason.java(5KB)
----Assignments()
--------PokerCard-MR&HBASE()
--------PokerCard-MR()
--------RelativeWordFrequency()
----AverageTaxiTime.java(7KB)
----AirlineOnTime.java(7KB)
----ProjectReport.pdf(174KB)
----AverageTaxiTime_Output.txt(202B)
----CancellationReason.jar(4KB)
----commands.txt(742B)