文件名称:REINDEER:REINDEER READ buquancE Query指数
文件大小:1.56MB
文件格式:ZIP
更新时间:2024-06-07 04:37:59
C++
REINDEER:在测序数据集中高效索引k-mer的存在和丰度 复制手稿的结果 引用与资源 进阶常见问题 动机 REINDEER建立了一个数据结构,该数据结构在一组数据集(例如原始RNA序列或宏基因组读取)中索引k-mers及其丰度。 然后,可以查询序列(FASTA)在每个索引数据集中是否存在和丰富。 虽然其他工具(例如SBT,BIGSI)也被设计用于大规模的k-mer存在/不存在查询,但迄今为止,仍不支持检索丰度(单个数据集除外,例如,使用某些k-mer计数器,例如KMC,水母)。 REINDEER在索引和查询期间结合了快速查询,较小的索引大小和较低的内存占用量。 我们展示了它允许使用少于60GB的RAM和小于60GB的磁盘上的最终索引大小来索引2585个RNA-seq数据集(约40亿个k-mers)。 然后,可以在磁盘上查询REINDEER索引(实验功能,RAM使用率低),也可以将
【文件预览】:
REINDEER-master
----install.sh(241B)
----test.sh(790B)
----src()
--------build_index.hpp(2KB)
--------eq_classes.cpp(5KB)
--------monotig.cpp(21KB)
--------monotig.hpp(2KB)
--------build_index.cpp(10KB)
--------launch_bcalm.cpp(3KB)
--------utils.cpp(13KB)
--------matrix_operation.hpp(1KB)
--------eq_classes.hpp(1KB)
--------launch_bcalm.hpp(522B)
--------bench_monotig.cpp(3KB)
--------matrix_operation.cpp(5KB)
--------reindeer.hpp(1KB)
--------query.hpp(4KB)
--------query.cpp(14KB)
--------reindeer.cpp(4KB)
--------utils.hpp(3KB)
----eqc_tests()
--------generate_eqc.py(843B)
--------run_eqc_test.sh(338B)
--------LOG_n_10M.txt(4KB)
----blight()
----reproduce_manuscript_results()
--------data()
--------assess_assumption_1.py(2KB)
--------assess_assumption_1.wrapper_scripts(643B)
--------bcalm_2585.sh(1KB)
--------README.md(4KB)
--------index_construction.sh(565B)
--------queries.sh(454B)
----LICENSE(34KB)
----.gitmodules(224B)
----bct()
----README.md(8KB)
----Images()
--------output_advanced.png(77KB)
--------reindeer.png(543KB)
--------reindeer_output.png(87KB)
----makefile(3KB)
----oneline_fasta(214B)
----main.cpp(9KB)
----bcalm2()
----test()
--------fof.txt(78B)
--------fof_unitigs.txt(90B)
--------output_bcalm()
--------input_bcalm()
--------out_test()
--------query_test.fa(114KB)
--------bench_monotig.cpp(4KB)
--------makefile(3KB)
--------reindeer_matrix_test(2KB)
--------query_results()
----trle()
--------trled.c(15KB)
--------trlec.c(13KB)
--------trle_.h(3KB)
--------conf.h(12KB)
--------trle.h(4KB)