文件名称:needle:快速高效地搜索NGS数据
文件大小:8.83MB
文件格式:ZIP
更新时间:2024-04-07 23:04:06
bloom-filters minimizer ngs-data ibf seqan3
针 Needle提供节省空间的数据结构来索引大量NGS数据,并允许快速搜索这些索引。由于一个索引的空间效率高,因此可以创建具有不同表达率的多个索引是可以承受的。因此,数据的半定量分析成为可能。 Needle基于交错式布隆过滤器,这是一种紧凑高效的结构,可以存储多个布隆过滤器。此外,Needle使用开窗方案(也称为最小化器)来减少要存储的数据量。 建造 可以通过以下命令来构建针头: git clone --recurse-submodules https://github.com/MitraDarja/needle.git mkdir build-needle && cd build-needle cmake ../needle make 运行测试以检查Needle是否按预期工作。所有测试都应通过。 make test 创建一个IBF 为了创建IBF,必须提供许多序列文件。 seqan3
【文件预览】:
needle-master
----.gitmodules(226B)
----CMakeLists.txt.in(444B)
----.github()
--------workflows()
----test()
--------benchmark()
--------cmake()
--------data()
--------api()
--------CMakeLists.txt(4KB)
--------coverage()
--------cli()
----include()
--------minimiser.h(2KB)
--------ibf.h(9KB)
--------estimate.h(4KB)
----src()
--------ibf.cpp(26KB)
--------main.cpp(14KB)
--------CMakeLists.txt(412B)
--------estimate.cpp(9KB)
----doc()
--------doxygen_cfg(109KB)
--------CMakeLists.txt(1KB)
----LICENSE.md(1KB)
----.gitignore(521B)
----CMakeLists.txt(1KB)
----lib()
--------robin-hood-hashing()
--------seqan3()
----README.md(5KB)