文件名称:dense-vector-ranking-performance:使用Vespa,Elasticsearch和Open Distro对Elasticsearch K-NN进行最近邻搜索的性能评估
文件大小:24KB
文件格式:ZIP
更新时间:2024-05-05 21:57:39
elasticsearch nearest-neighbors tensors vespa-engine Python
使用Vespa和Elasticsearch进行最近邻搜索的性能评估 在此存储库中,我们对Elastic中密集矢量类型的性能进行基准测试,并将其与的。 Elastic最近发布了对高达1024维的密集和稀疏向量的支持,请参阅。 稀疏张量类型后来被弃用。 我们评估使用Vespa和Elasticsearch的执行最近邻搜索的性能。 执照 这项工作在APACHE 2.0下发布 介绍 对于许多实时应用而言,在高维向量空间中快速搜索数据点的最近邻居是一个重要的问题。 例如,在“计算机视觉”中,在高维向量空间中搜索接近的数据点可以在大型图像数据集中找到最相似的猫或脸。 在信息检索中,像BERT这样的大型预训练多语言自然语言理解模型允许在表示文本句子,其中最近邻居搜索可以充当有效的多语言语义检索功能。 在(近似)最近邻居搜索的许多这些实词应用程序中,搜索都受到应用于数据点的元数据的实时查询过滤器的约束。
【文件预览】:
dense-vector-ranking-performance-master
----Dockerfile.vespa(102B)
----config()
--------opendistroforelasticsearch()
--------elastic()
--------vespa()
----LICENSE(11KB)
----README.md(15KB)
----data()
--------opendistroforelasticsearch()
--------elastic()
--------vespa()
----Dockerfile.elastic(187B)
----bin()
--------build.sh(226B)
--------check-recall.py(3KB)
--------do-benchmark.sh(932B)
--------run.sh(384B)
--------opendistroforelasticsearch()
--------make-queries.py(1KB)
--------elastic()
--------vespa()
--------make-feed.py(986B)
----Dockerfile.opendistroforelasticsearch(344B)