【文件属性】:
文件名称:Streaming开发实例-hadoop基础培训ppt
文件大小:1007KB
文件格式:PPT
更新时间:2021-04-25 21:28:40
大数据hadoop
Streaming开发实例
--map脚本内容
#!/usr/bin/python
import sys
for eachLine in sys.stdin: #从标准输入获取数据
eachLine = eachLine.strip()
Seg = eachLine.split(‘|’) #用\t来分割开各个字段
if len(Seg) == 19 and Seg[1] == 'rpt_cad' and Seg[6] != '':
ad_id = Seg[6]
print ‘%s\t%d’ % (ad_id, 1) #将map结果送到标准输出
else:
pass
文件名:cat ad_day_pv_map.py