文件名称:edyeet:使用edlib和mashmap2进行碱基精确的DNA序列比对
文件大小:1.19MB
文件格式:ZIP
更新时间:2024-05-30 17:56:56
C++
埃德耶特 edyeet是一个叉 ,使用工具基层对准经由瓷砖波前全局比对算法。 它使用高性能的比对模块完善了MashMap,该模块能够计算非常大的序列的基本水平比对。 过程 每个查询序列分为-s[N], --segment-length=[N]定义的非重叠部分。 然后使用MashMap的滑动minhash映射算法和后续的过滤步骤来映射这些段。 为了减少内存,临时文件用于存储初始映射。 然后,将每个映射位置用作使用edlib进行对齐的目标。 结果对齐方式在cg:Z:*标记中始终包含扩展的CIGAR。 可以使用-m, --approx-map获得近似映射(等效于MashMap )。 默认情况下,映射合并是禁用的,因为在合理的标识范围内将合并的近似映射与edlib对齐可能会产生很长的运行时间。 但是,合并在某些设置中可能很有用,并通过-M, --merge-mappings启用。 草图绘制,