pqkmeans:快速且内存高效的群集

时间:2024-02-24 00:49:26
【文件属性】:

文件名称:pqkmeans:快速且内存高效的群集

文件大小:458KB

文件格式:ZIP

更新时间:2024-02-24 00:49:26

computer-vision clustering scikit-learn k-means product-quantization

PQk均值 | | 同时使用k均值和PQk均值的2D示例 大规模评估 是一个Python库,用于对大型数据进行有效的聚类。 通过首先将输入向量压缩为短乘积量化(PQ)码,PQk-means可以实现快速且高效存储的聚类,即使对于高维向量也是如此。 与k-means相似,PQk-means重复分配和更新步骤,二者均可以在PQ代码域中执行。 为了进行比较,我们提供了用于二进制转换的ITQ编码和用于二进制代码聚类的 。 该库使用C ++编写,用于主要算法以及Python的包装程序。 所有编码/群集代码均与scikit-learn兼容。 功能概要 k均值的逼近 比k均值快几十到几百倍 内存效率是k均值的数十到数百倍 与scikit-learn兼容 便携式一站式安装 安装 必需品 CMake的 用于OS X的brew install cmake sudo apt install cmake为Ubuntu sudo apt install cmake OpenMP(可选) 如果安装了openmp,它将自动用于并行化算法以加快计算速度。 编译安装 您可以从PyPI安装该库: pip ins


【文件预览】:
pqkmeans-master
----setup.py(4KB)
----.gitignore(1KB)
----requirements.txt(62B)
----ext()
--------pybind()
----src()
--------encoder()
--------clustering()
--------_pqkmeans.cpp(2KB)
----bin()
--------run_experiment.py(2KB)
----MANIFEST.in(146B)
----LICENSE(1KB)
----.gitmodules(90B)
----README.md(5KB)
----pqkmeans()
--------encoder()
--------clustering()
--------__init__.py(93B)
--------evaluation.py(3KB)
----tutorial()
--------1_pqkmeans.ipynb(19KB)
--------2_image_clustering.ipynb(558KB)
--------4_comparison_to_faiss.ipynb(19KB)
--------3_billion_scale_clustering.ipynb(9KB)
----test()
--------encoder()
--------clustering()
--------__init__.py(0B)
----CMakeLists.txt(486B)

网友评论