Hadoop-Analytics---RHadoop

时间:2024-06-23 23:24:03
【文件属性】:

文件名称:Hadoop-Analytics---RHadoop

文件大小:98KB

文件格式:ZIP

更新时间:2024-06-23 23:24:03

Java

Hadoop-Analytics---RHadoop 简短描述 在本项目中,您将编写在 Hadoop 中实现数据挖掘和机器学习技术的 map-reduce 作业。 更具体地说,您将实施 K-Means 聚类技术并学习 RHadoop。 问题 1(K-Means 聚类)[50 分] K-Means 聚类是一种流行的算法,用于将相似对象聚类为 K 组(聚类)。 它以 K 个点(随机选择)的初始种子作为中心开始,然后算法迭代地尝试增强这些中心。 当两次连续迭代产生相同的 K 个中心,即中心没有改变,或者达到最大迭代次数时,算法终止。 提示:您可以参考这些链接以获得一些想法(除了课程幻灯片): : Step 1(创建数据集)[10 点]: • 创建一个由二维点组成的数据集,即每个点都有 (x, y) 值。 X 和 Y 值的范围分别为 0 到 10,000。 每个点都在单独的一条线上。 •


【文件预览】:
Hadoop-Analytics---RHadoop-master
----PROBLEM-2()
--------sorted.png(22KB)
--------Countrycode.R(1KB)
--------unsorted.png(20KB)
----.gitignore(574B)
----PROBLEM-1()
--------KMeans.java(11KB)
--------CreateTrainingDataSet.java(635B)
--------CustomDataset.java(859B)
----README.md(3KB)
----README.docx(56KB)
----.gitattributes(378B)

网友评论