文件名称:Spectral-Clustering-Algorithms
文件大小:1.5MB
文件格式:ZIP
更新时间:2024-06-15 05:17:18
Scala
谱聚类算法示例 该软件包包含我们在Apache Spark上初步实现的几种版本的光谱聚类算法的源代码,它们是: 1. Parallel Spectral Clustering based on t-nearrest neighbors(PSC) 2. Parallel Spectral Clustering based on Nystrom optimization(NYSC) 3. Parallel Spectral Clustering based on Locality Sensitive Hashing(DASC) 跑步 您需要安装Spark 1.3.0或更高版本以及hadoop 1.0.4作为存储支持。 使用sbt构建后,使用spark-submit工具将应用程序提交到Spark集群。 Step1: Generate data using "DataGenerator"