文件名称:Blight:低内存中的De Bruijn图表示
文件大小:348KB
文件格式:ZIP
更新时间:2024-06-16 05:35:00
C++
枯萎病 de Bruijn基于图的索引,具有轻量内存使用 鸟瞰: Blight是一种类似于哈希表的关联数据结构,能够索引kmer集。 它将每个kmer与唯一的标识符相关联,并且可以标识与标识符-1相关的外星人kmers(索引中不存在的kmer)。 kmer标识符为in [0,N [,其中N是索引中的kmer数。 因此,人们可以将Blight视为处理外星人kmers的最小完美哈希函数(MPHF)。 关键特性: 疫病指数是 确定性的,它不会产生假阳性或假阴性。 根据压缩的de Bruijn图构建 静态的,一旦构造,索引的kmer集就无法修改 即使对于最广泛的kmer集,也具有快速且高效的存储功能 图的构造 要构建Blight索引,需要一个Fasta文件,该文件的序列包含要索引的kmer,没有重复项。 构建此类文件的有效方法是根据兴趣序列构建压缩的de Bruijn图。 我们建议使用BCA
【文件预览】:
Blight-master
----blight.cpp(47KB)
----wdir()
--------torm.txt(0B)
----blight.h(10KB)
----My_debruijn_graph.fa(82B)
----.clang-format(3KB)
----snippet.cpp(6KB)
----code_sample()
--------Colored_De_Bruijn_graph_snippet.cpp(5KB)
--------query_index.cpp(1KB)
--------interactive.cpp(24KB)
--------Abundance_De_Bruijn_graph_snippet.cpp(5KB)
----README.md(6KB)
----utils.h(4KB)
----lz4()
--------xxhash.h(13KB)
--------lz4frame.h(28KB)
--------lz4.c(99KB)
--------xxhash.c(33KB)
--------lz4hc.c(65KB)
--------lz4frame_static.h(2KB)
--------lz4hc.h(21KB)
--------lz4_stream.h(8KB)
--------lz4frame.c(76KB)
--------lz4.h(39KB)
----makefile(1KB)
----utils.cpp(10KB)
----bench_blight.cpp(3KB)
----include()
--------bm.h(218KB)
--------bmblocks.h(74KB)
--------bmundef.h(2KB)
--------bmfunc.h(228KB)
--------MurmurHash3.cpp(8KB)
--------MurmurHash3.h(1KB)
--------conf.h(12KB)
--------bm64.h(33B)
--------common.h(2KB)
--------trled.c(15KB)
--------bmutil.h(11KB)
--------bbhash.h(22KB)
--------trle.h(4KB)
--------bmtrans.h(25KB)
--------encoding.h(49KB)
--------bmbuffer.h(21KB)
--------bmserial.h(206KB)
--------bmconst.h(12KB)
--------trlec.c(13KB)
--------bmdef.h(10KB)
--------bmalgo_impl.h(60KB)
--------robin_hood.h(75KB)
--------bmrs.h(17KB)
--------bmalgo.h(19KB)
--------bmfwd.h(2KB)
--------bmalloc.h(10KB)
--------zstr.hpp(13KB)
--------strict_fstream.hpp(6KB)
--------bmsimd.h(2KB)
--------bmxor.h(19KB)