文件名称:clustered_elias_fano_indexes:聚簇的Elias-Fano倒排索引
文件大小:155.08MB
文件格式:ZIP
更新时间:2024-06-04 05:32:56
inverted-index elias-fano C++
聚类的Elias-Fano索引 这是Giulio Ermanno Pibiri和Rossano Venturini撰写的论文的实验代码,该论文发表在ACM TOIS 2017 [1]中。 本指南旨在提供该库的简要概述,并通过一些示例来说明其功能。 目录 构建代码 该代码已在Linux Ubuntu上使用gcc 5.4.1进行了测试。 构建需要以下依赖项: CMake > = 2.8和Boost > = 1.58。 该代码主要基于项目,因此它依赖于几个子模块。 如果克隆的存储库没有--recursive ,则在构建之前需要执行以下命令: $ git submodule init $ git submodule update 要在Unix系统上构建代码(有关使用的编译标志,请参见CMakeLists.txt文件),只需执行以下操作: $ mkdir build $ cd build
【文件预览】:
clustered_elias_fano_indexes-master
----compact_ranked_bitvector.hpp(12KB)
----uniform_partitioned_sequence.hpp(12KB)
----stxxl()
----block_posting_list.hpp(13KB)
----clustered_sequence.hpp(14KB)
----bm25.hpp(724B)
----create_clustered_freq_index_sb.cpp(6KB)
----interpolative_coding.hpp(4KB)
----create_freq_index.cpp(9KB)
----.gitmodules(240B)
----reference_selector.hpp(18KB)
----sequence_collection.hpp(4KB)
----binary_freq_collection.hpp(3KB)
----strict_sequence.hpp(7KB)
----compact_elias_fano.hpp(15KB)
----clustered_index_types.hpp(312B)
----scripts()
--------filter_plists.py(2KB)
----queries.cpp(6KB)
----binary_collection.hpp(4KB)
----global_parameters.hpp(882B)
----optimal_partition.hpp(4KB)
----semiasync_queue.hpp(3KB)
----all_ones_sequence.hpp(3KB)
----indexed_sequence.hpp(7KB)
----configuration.hpp(2KB)
----CMakeLists.txt(2KB)
----succinct()
----block_freq_index.hpp(5KB)
----LICENSE(651B)
----clustered_binary_freq_collection.hpp(4KB)
----index_build_utils.hpp(4KB)
----README.md(7KB)
----FastPFor()
----clustered_binary_collection.hpp(4KB)
----queries.hpp(20KB)
----create_clustered_freq_index_fb.cpp(7KB)
----cluster.hpp(4KB)
----clustered_freq_index.hpp(10KB)
----test_data()
--------queries(6KB)
--------test_collection.bin.freqs.gz(36.71MB)
--------test_collection.lists_positions.gz(1KB)
--------test_collection.bin.docs.part_1.gz(93.29MB)
--------test_collection.bin.docs.part_2.gz(58.99MB)
--------test_collection.clusters.gz(1KB)
----wand_data.hpp(5KB)
----freq_index.hpp(8KB)
----compute_clusters.cpp(18KB)
----integer_codes.hpp(1KB)
----.gitignore(62B)
----strict_elias_fano.hpp(3KB)
----create_wand_data.cpp(3KB)
----util.hpp(7KB)
----index_types.hpp(2KB)
----block_profiler.hpp(2KB)
----bitvector_collection.hpp(3KB)
----block_codecs.hpp(12KB)
----positive_sequence.hpp(3KB)
----verify_collection.hpp(4KB)
----partitioned_sequence.hpp(17KB)