文件名称:OPERA-MS:OPERA-MS-混合元基因组组装器
文件大小:115.1MB
文件格式:ZIP
更新时间:2024-05-26 13:13:02
C++
介绍 OPERA-MS是一种混合型宏基因组汇编器,结合了短读和长读技术的优点,可提供高质量的汇编,解决了短读组装的低连续性和长读组装的低碱基对质量的问题。 OPERA-MS已在使用不同的长读技术(包括牛津纳米Kong,PacBio和Illumina合成长读)测序的模拟和真实社区上进行了广泛的测试,并且对读取数据中的噪声特别健壮。 OPERA-MS采用分段组装策略,该策略旨在利用低覆盖率的长时间读取数据来改善基因组组装。 它从构建一个短读的宏基因组程序集(默认值: )开始,该程序集可以很好地表示元基因组中的基础序列,但可能会被片段化。 然后,将长读取和短读取映射到程序集,以识别重叠群之间的连通性并计算读取的覆盖率信息。 这是OPERA-MS算法核心的基础,该算法将利用基于贝叶斯模型的方法利用覆盖率和连接性信息将重叠群准确地聚类到基因组中。 OPERA-MS的另一个重要优点是,它可以对元基