spark-python-knn:Apache Spark中用于计算K-NN的函数

时间:2024-05-24 06:46:10
【文件属性】:

文件名称:spark-python-knn:Apache Spark中用于计算K-NN的函数

文件大小:7KB

文件格式:ZIP

更新时间:2024-05-24 06:46:10

Python

Spark Python K-nn 简单但具有存储效率的函数,用于计算K个最近的邻居。 需要 安装Numpy,scikit-learn。 安装 将jakac:spark-python-knn:0.0.3添加到您的应用程序要求中: $SPARK_HOME/bin/pyspark --packages jakac:spark-python-knn:0.0.3 用法 ```python from gaussalgo.knn import compute_neighbors import numpy as np left = sc.parallelize([ (1, np.array([0,0,1,1])), (2, np.array([0,1,1,1])), (3, np.array([0,0,1,1])), (4, np.ar


【文件预览】:
spark-python-knn-master
----python()
--------MANIFEST.in(256B)
--------spark-package-deps.txt(118B)
--------setup.cfg(192B)
--------requirements.txt(57B)
--------setup.py(1KB)
--------tests.py(965B)
--------gaussalgo()
----LICENSE(578B)
----README.md(2KB)

网友评论