文件名称:hadoop-kmeans:使用 Hadoop 实现 K-Means 算法
文件大小:559KB
文件格式:ZIP
更新时间:2024-08-03 11:36:49
Java
Hadoop K-Means 使用 Hadoop 的 K-Means 算法实现。 该算法不执行任何初始质心的计算,必须给出这些。 用法 家庭输入集群数量输出增量最大 hadoop jar HadoopKMeans.jar com.jgalilee.hadoop.kmeans.driver.Driver \ input/kmeans.state \ input/points.txt \ input/clusters.txt \ 2 \ output/ \ 0.0 \ 5 home - 每次迭代都可以写入文件名迭代状态的路径。 input - 输入点数据的路径。 集群 - 输入集群数据的路径。 number - 向 Hadoop 作业建议的减速器数量。 output - 为迭代 n 写入输出的路径 - 即 output/n delta - 定义最后一个
【文件预览】:
hadoop-kmeans-master
----input()
--------clusters.txt(339B)
--------clusters.txt.txt(339B)
--------kmeans.state(40KB)
--------points.txt(1.03MB)
--------.kmeans.state.crc(0B)
----build.xml(2KB)
----src()
--------com()
----run.sh(252B)
----.gitignore(17B)
----README.md(2KB)