hbase-kmeans:使用 HBase 和 Map Reduce 的迭代 k 均值

时间:2024-06-21 07:00:51
【文件属性】:

文件名称:hbase-kmeans:使用 HBase 和 Map Reduce 的迭代 k 均值

文件大小:7KB

文件格式:ZIP

更新时间:2024-06-21 07:00:51

Java

hbase-kmeans 使用 HBase 和 Map Reduce 的迭代 k 均值 问题陈述 通过迭代运行 Map Reduce 作业,在 HBase 平台上使用 K-means 对能源效率数据集 ( ) 进行聚类。 数据加载到 Hbase 由 DataLoader 类执行。 该类将 Energy Efficiency 数据集(通过将数据视为 10 维特征向量)导入名为“data”的 HBase 表。数据导入到 2 个不同的列族:Area 和 Property。 导入数据的步骤: 删除任何现有的数据表。 从程序参数 (args[0]) 中获取包含数据的本地文本文件的路径。 存储簇数。 这也是从程序参数 (args[1]) 中获得的。 使用 Map Reduce Job 将数据导入到“数据”表中。 此外,在名为“center”的表中加载前 k 行作为初始聚类中心。 运行


【文件预览】:
hbase-kmeans-master
----src()
--------Program.java(1KB)
--------JobRunner.java(11KB)
--------DataLoader.java(6KB)
----.gitignore(189B)
----README.md(2KB)

网友评论