Ratatosk:使用彩色de Bruijn图进行长读取的混合错误校正

时间:2024-05-29 12:31:20
【文件属性】:

文件名称:Ratatosk:使用彩色de Bruijn图进行长读取的混合错误校正

文件大小:94KB

文件格式:ZIP

更新时间:2024-05-29 12:31:20

C++

拉塔托斯克 使用彩色de Bruijn图进行长读取的阶段性混合错误校正 Ratatosk是基于错误的长读的分阶段错误纠正工具,该错误的长读基于从准确的短读构建的压缩和彩色de Bruijn图。 短图和长读图上的颜色路径,而顶点用候选de novo单核苷酸多态性注释。 随后使用精确和不精确的k- mer匹配将长读段锚定在图上,以找到与校正序列相对应的路径。 我们证明,Ratatosk可以将牛津纳米Kong的原始错误率平均降低6倍,中值错误率低至0.28%。 与原始数据相比,Ratatosk校正后的数据可保持近99%的SNP准确调用率,并将indel调用的准确性提高多达40%。 由Ratatosk校正后的ONT读数创建的Ashkenazi个体HG002的程序集产生的重叠群N50为43.22 Mbp,并且比从PacBio HiFi读数创建的程序集产生的错配更少。 目录 要求 C ++ 11编译器


【文件预览】:
Ratatosk-master
----.gitignore(308B)
----src()
--------Alignment.hpp(2KB)
--------Path.hpp(12KB)
--------PairID.hpp(6KB)
--------Common.hpp(7KB)
--------edlib.h(10KB)
--------UnitigData.hpp(14KB)
--------Correction.cpp(33KB)
--------PairID.cpp(27KB)
--------Correction.hpp(2KB)
--------Ratatosk.cpp(26KB)
--------GraphTraversal.hpp(4KB)
--------Graph.cpp(75KB)
--------edlib.cpp(63KB)
--------ResultCorrection.hpp(4KB)
--------Graph.hpp(2KB)
--------Common.cpp(6KB)
--------TinyBloomFilter.hpp(6KB)
--------GraphTraversal.cpp(36KB)
--------Alignment.cpp(27KB)
--------CMakeLists.txt(2KB)
----LICENSE(1KB)
----.gitmodules(81B)
----scripts()
--------reference_guiding()
----README.md(11KB)
----phasing.md(3KB)
----Bifrost()
----CMakeLists.txt(927B)

网友评论