文件名称:PokemonDataAnalysis:Hadoop-神奇宝贝数据分析
文件大小:28KB
文件格式:ZIP
更新时间:2024-06-02 06:37:26
Java
Hadoop-神奇宝贝数据分析 动机和背景 该项目包括分析出于不同目的的不同神奇宝贝数据。 我们专注于做十大列表和某些值的平均值。 我们选择这个项目是因为它看起来很有趣而且很有创造力。 我们小时候在电视上看《神奇宝贝》,因为我们很熟悉这个主题,所以我们很容易制作这个项目。 数据集由包含有关神奇宝贝的信息的csv文件表示。 该信息按10列组织,如下所示:数字,名称,类型1,类型2,总计,生命值,攻击,防御,特殊攻击,特殊防御和速度,它们每个都包含由字符串或数字表示的不同值。 对于处理部分,数据集必须满足一些完善的结构。 由于csv文件由10列构成,因此在Type 2列上有很多空单元格,必须填充预定义的符号才能获得应有的格式。 该项目的目的包括5个任务: 根据它们的总力量找出排名前十的神奇宝贝; 找出十大最快的神奇宝贝; 找出所有神奇宝贝的平均HP(命中点); 根据他们的特殊攻击找出前十名神
【文件预览】:
PokemonDataAnalysis-master
----pokemon()
--------pom.xml(2KB)
--------_project.xml(536B)
--------.settings()
--------src()
--------_classpath.xml(998B)
----PokemonData.csv(38KB)
----.gitignore(272B)
----README.md(3KB)
----.gitattributes(66B)