文件名称:gcsa2:基于BWT的图形索引
文件大小:134KB
文件格式:ZIP
更新时间:2024-06-04 19:19:47
C++
GCSA2 这是广义压缩后缀数组(GCSA)的重新实现,广义压缩后缀数组是基于BWT的有向图索引。 有关更多文档,请参见 。 概述 在有向无环图中索引了所有路径,必须在构造索引之前确定这些路径。 GCSA2用de Bruijn图( k = 256或更小)近似图,从而可以索引更复杂的图以及包含循环的图。 de Bruijn图的顺序限制了索引能够正确回答的查询的长度。 较长的查询可能会导致误报(但不会导致误报)。 索引构造的输入是输入图中长度为k的一组路径。 前缀加倍算法将输入转换成8k (order- 2k ,order- 4k ,order- 16k )修剪的de Bruijn图,用于输入图中的路径。 修剪的de Bruijn图与de Bruijn图的不同之处在于,如果较短的标签唯一确定输入图中相应路径的起始节点,则其节点的标签可能比图形的顺序短。 因此,修剪的de Bruijn图通
【文件预览】:
gcsa2-master
----paper()
--------gcsa2_graph_dbg.isy(111B)
--------paper.bib(29KB)
--------gcsa2_pruned_index.ipe(56KB)
--------ltexpprt.sty(11KB)
--------gcsa2_text_indexes.ipe(20KB)
--------gcsa2_text_indexes.isy(114B)
--------paper.tex(78KB)
--------Makefile(661B)
--------gcsa2_graph_dbg.ipe(23KB)
--------gcsa2_pruned_index.isy(114B)
----files.cpp(18KB)
----install.sh(2KB)
----algorithms.cpp(20KB)
----path_graph.cpp(38KB)
----lcp.cpp(14KB)
----gcsa_format.cpp(8KB)
----try_extend.cpp(2KB)
----benchmark()
--------count_kmers.cpp(6KB)
--------query_gcsa.cpp(7KB)
--------Makefile(2KB)
--------csa_query.cpp(6KB)
--------csa_builder.cpp(3KB)
----LICENSE(1KB)
----support.cpp(16KB)
----README.md(3KB)
----Makefile(2KB)
----build_gcsa.cpp(8KB)
----internal.cpp(3KB)
----dbg.cpp(6KB)
----gcsa.cpp(29KB)
----utils.cpp(7KB)
----.gitignore(293B)
----convert_graph.cpp(2KB)
----include()
--------gcsa()