【文件属性】:
文件名称:sales-by-store:查找所有商店的总销售额、按产品类别划分的销售额、每个单独商店的最高个人销售额、总销售额等
文件大小:4KB
文件格式:ZIP
更新时间:2021-06-09 13:08:42
Python
Hadoop 上按商店计算的销售额 (Cloudera CDH)
项目 - Hadoop 和 MapReduce 简介:Udacity
样本输入数据格式
2012-01-01 09:00 圣何塞男装 214.05 美国运通
2012-01-01 09:00 沃思堡女装 153.57 签证
2012-01-01 09:00 圣地亚哥音乐 66.08 现金
2012-01-01 09:00 匹兹堡宠物用品 493.51 发现
查找每家商店的销售额
mapper.py:从输入文件中读取商店和销售数据
reducer.py : 计算每家商店的销售额
查找每个类别的销售额
mapper2.py : 从输入文件中读取 ite 和 sales 数据
reducer2.py : 计算每件商品的销售额
找出每个独立商店的最高单笔销售额的货币价值
映射器3.py
减速器3.py
找出所有商店的总销售额和总
【文件预览】:
sales-by-store-master
----mapper4.py(397B)
----mapper2.py(407B)
----reducer2.py(476B)
----reducer3.py(550B)
----README.md(882B)
----mapper3.py(408B)
----reducer4.py(190B)
----reducer.py(559B)
----mapper.py(249B)