文件名称:spark-knn:Spark上的k最近邻算法
文件大小:67KB
文件格式:ZIP
更新时间:2024-06-03 04:52:04
spark knn Scala
Spark-KNN 在制品... 在Apache Spark上实现的k最近邻居算法(k-NN)。 这使用混合溢出树方法来实现高精度和搜索效率。 k-NN的简单性和调整参数的缺乏使k-NN成为许多机器学习问题的有用基线模型。 如何使用 该软件包使用,链接信息可在找到 k-NN可用于分类和回归,这使用基于DataFrame的新 API公开。 两种模型均接受权重列,因此可以选择对预测进行加权。 KNN分类器 // read in raw label and features val training = MLUtils .loadLibSVMFile(sc, " data/mllib/sample_libsvm_data.txt " ).toDF() val knn = new KNNClassifier () .setTopTreeSize(training.count().toIn
【文件预览】:
spark-knn-master
----.travis.yml(503B)
----spark-knn.Rproj(205B)
----data()
--------mnist()
----python()
--------test.py(1KB)
--------pyspark_knn()
--------setup.py(194B)
----spark-knn-examples()
--------src()
----LICENSE(11KB)
----build.sbt(856B)
----dev()
--------benchmark.sh(4KB)
----spark-knn-core()
--------src()
----.gitignore(296B)
----scalastyle-config.xml(6KB)
----project()
--------Common.scala(1KB)
--------plugins.sbt(766B)
--------SparkSubmit.scala(690B)
--------Dependencies.scala(643B)
--------build.properties(21B)
----README.md(6KB)
----.gitattributes(125B)