MashMap:适用于长DNA序列的快速近似比对仪

时间:2024-06-01 08:40:14
【文件属性】:

文件名称:MashMap:适用于长DNA序列的快速近似比对仪

文件大小:161KB

文件格式:ZIP

更新时间:2024-06-01 08:40:14

C++

MashMap MashMap实现了一种快速且近似的算法,用于计算长DNA序列之间的局部比对边界。 对于将基因组装配或长读(PacBio / ONT)映射到参考基因组可能很有用。 给定最小对齐长度和所需局部对齐的同一性阈值,Mashmap使用k -mers计算对齐边界和同一性估计。 它不会显式计算比对,而是使用和的组合来估计基于k- mer的。 然后使用距离将其转换为序列同一性的估计值。 使用给定的最小局部比对长度和同一性阈值,可以自动确定合适的k- mer采样率。 随着这两个阈值的增加,算法的效率也会提高。 例如,Mashmap可以在大约一分钟的总执行时间内将人类基因组装配图映射到人类参考基因组,并且仅使用8个CPU线程即可将其存储在<4 GB的内存中,与其他方法相比,运行时和内存的改善都超过了一个数量级。 。 我们将描述与Mashmap相关的算法,并在列出的出版物中报告该软件的速度


【文件预览】:
MashMap-master
----.gitignore(205B)
----Makefile.in(755B)
----src()
--------align()
--------common()
--------map()
----configure.ac(1KB)
----INSTALL.txt(2KB)
----LICENSE.txt(2KB)
----scripts()
--------generateDotPlot(31KB)
--------denovo_repeat_annotation.py(2KB)
----README.md(6KB)
----bootstrap.sh(8B)

网友评论