文件名称:Streaming开发实例-hadoop基础培训ppt
文件大小:1007KB
文件格式:PPT
更新时间:2024-05-15 15:15:20
大数据hadoop
Streaming开发实例 --map脚本内容 #!/usr/bin/python import sys for eachLine in sys.stdin: #从标准输入获取数据 eachLine = eachLine.strip() Seg = eachLine.split(‘|’) #用\t来分割开各个字段 if len(Seg) == 19 and Seg[1] == 'rpt_cad' and Seg[6] != '': ad_id = Seg[6] print ‘%s\t%d’ % (ad_id, 1) #将map结果送到标准输出 else: pass 文件名:cat ad_day_pv_map.py