【文件属性】:
文件名称:Spectral-Clustering-Algorithms
文件大小:1.5MB
文件格式:ZIP
更新时间:2021-05-26 11:30:38
Scala
谱聚类算法示例
该软件包包含我们在Apache Spark上初步实现的几种版本的光谱聚类算法的源代码,它们是:
1. Parallel Spectral Clustering based on t-nearrest neighbors(PSC)
2. Parallel Spectral Clustering based on Nystrom optimization(NYSC)
3. Parallel Spectral Clustering based on Locality Sensitive Hashing(DASC)
跑步
您需要安装Spark 1.3.0或更高版本以及hadoop 1.0.4作为存储支持。
使用sbt构建后,使用spark-submit工具将应用程序提交到Spark集群。
Step1: Generate data using "DataGenerator"