文件名称:CONSULT:使用局部敏感的散列法精确去除污染物
文件大小:21.94MB
文件格式:ZIP
更新时间:2024-05-06 05:59:14
C++
咨询 CONSULT是从基因组测序读取中去除污染物的工具。 依靠位置敏感的哈希,CONSULT从查询集中提取k -mers,并测试它们是否落在参考数据集中用户指定的k -mers汉明距离内。 它支持在其参考库中包含大约80亿个k- mers,以容纳数以万计的微生物物种的数据集。 现在,我们可以在线( )上获得描述算法和软件体系结构设计的论文。 我们在测试期间使用的摘要数据表和脚本可从。 原始数据存放在。 我们使用不同基因组参考集构建的自定义CONSULT库: 目前,在使用我们的库时,库名称必须保持不变,因为库文件以库名称为前缀。 这将在将来的版本中更改,以提供更大的灵活性。 系统要求 磁盘空间: CONSULT数据库的构建大约需要120GB的磁盘空间。 确切的覆盖区取决于参考集中的k个单体。 我们为使用默认设置进行测试而构建的三个主要数据库的大小在107GB至120GB之间变化。
【文件预览】:
CONSULT-main
----minimization.cpp(7KB)
----map_fixed_pos()
--------README.md(104B)
--------main_map_fixed_pos.cpp(36KB)
----k35C_bef_mininimization.fa(22.32MB)
----main_search.cpp(39KB)
----LICENSE(11KB)
----main_map.cpp(36KB)
----README.md(11KB)
----query_set()
--------test.cpp(1B)
--------G000307305.fq(20.77MB)
----ucseq_G000307305.fq(8.85MB)
----k32C_af_mininimization.fa(20.6MB)
----CHANGELOG.md(1B)