文件名称:hadoop-lab:Hadoop技术讲座的实验室内容
文件大小:21KB
文件格式:ZIP
更新时间:2024-06-06 16:07:41
Java
Hadoop实验室 在本实验中,我们将为我们的信用卡客户创建一个采购资料。 这将使我们能够使用历史数据来即时判断信用卡交易的置信度。 首先,我们将数据上传到Hadoop集群并执行一些基本查询。 然后,我们将创建一个MapReduce作业,以按州计算支出。 最后,我们将把Drools与我们的MapReduce工作集成在一起,以灵活地映射和简化逻辑。 先决条件 下载 下载 启动Hadoop集群 安装VirtualBox 您可能需要运行`/etc/init.d/vboxdrv setup' 您将需要确保已在sudo yum install gcc 您将需要确保使用sudo yum install kernel-devel kernel-headers安装了内核源代码/ sudo yum install kernel-devel kernel-headers 将Hortworks设备导入
【文件预览】:
hadoop-lab-master
----purchasing-profile()
--------pom.xml(3KB)
--------src()
----data()
--------transactions.csv(272B)
----state-total()
--------pom.xml(2KB)
--------src()
----.gitignore(254B)
----README.md(8KB)
----stream()
--------generate_transactions.py(2KB)
--------flume.conf(1018B)