文件名称:大数据综合案例-搜狗搜索日志分析(修复版final).doc
文件大小:3.28MB
文件格式:DOC
更新时间:2023-01-09 17:16:05
hive hadoop MapReduce 大数据离线分析项目
基于搜狗查询数据500w条使用MapReduce做数据清洗,hive做离线分析的项目,详细文档附数据连接,搜狗实验室的搜索数据下载后缺少了用户ID字段的数据,所以本分析采用的是完整的数据,大家可以放心下载,如果下载数据的百度云链接失效无法下载,大家可以给我留言。