文件名称:bigdataProject:使用brawlstars api进行抓取并保存到hadoop
文件大小:16.39MB
文件格式:ZIP
更新时间:2024-03-08 03:36:30
HiveQL
大数据项目 브롤스타즈api를이용한터수집이터수집 프로젝트 파이썬을이용해로그 mysql테이블에 mysql의터를이터를스쿱을이용해hdfs로이동 hdfs파일을하이브외부테이블이디렉토리로이동 제플린에서하이브를이용해데이터를 데이터 获取(/ rankings / {countryCode} / players)플레랭커들의이어태그를태그를 Get(/ players / {playerTag} / battlelog)플레이어배틀로배틀 데이터 Python DB_connection.py sqlalchemy的python的vm的mysql的다。 crawling_ranking.py crawling_func()이정정보를가져온다。 rank.py crawling_func()랭킹정보를가져온다。 Flatten용해이용해json데이터를뒤이터프
【文件预览】:
bigdataProject-master
----crawling_code()
--------.DS_Store(6KB)
--------DB_connection.py(190B)
--------ranking.py(579B)
--------battlelog.py(3KB)
--------crawling_ranking.py(410B)
--------__pycache__()
----hive()
--------team_winning.hql(691B)
--------best_mode.hql(111B)
--------.DS_Store(6KB)
--------best_combination.hql(848B)
--------map_best_brawler.hql(614B)
--------team_list.hql(660B)
--------create_external_table.hql(1KB)
--------best_brawler.hql(472B)
--------best_map.hql(122B)
--------hive.hql(4KB)
----workflow()
--------brawl.xml(1KB)
--------brawl_coordinator.xml(378B)
--------.DS_Store(6KB)
--------mysql.sh(163B)
--------hdfs.sh(105B)
----README.md(4KB)
----발표ppt.pdf(7.4MB)
----zeppelin_result.mp4(9.66MB)
----brawstars.sql(1KB)
----zeppelin()
--------Brawlstars.json(28KB)