deGSM:可扩展内存中的de Bruijn图构造器

时间:2024-05-17 19:58:15
【文件属性】:

文件名称:deGSM:可扩展内存中的de Bruijn图构造器

文件大小:10.04MB

文件格式:ZIP

更新时间:2024-05-17 19:58:15

C++

介绍 deGSM是一种内存灵活的多线程de bruijn图构造函数。 它适用于为多个参考基因组和大型重测序数据集构建和压缩de bruijn图。 deGSM是一种并行算法,它使用块排序和多路合并的方法彻底解决了内存瓶颈问题。 deGSM从k-mer计数器获取k-mers,并直接在BWT序列中构建图压缩。 deGSM还支持将BWT字符串并行转换为.fasta格式的单路径。 deGSM成功构建了Contig(305Gbp)和Scaffold(1.1Tbp)和Picea abies测序数据集(9.7Tbp)的GenBank序列数据库图,同时保持了较小且灵活的内存使用量。 deGSM主要由刘波和郭洪哲设计,郭洪哲在中国哈尔滨工业大学生物信息学中心开发。 记忆需求 deGSM的内存使用量和磁盘空间使用量可以适合大多数现代服务器和工作站的配置。 用户可以配置其峰值内存占用量,并且峰值磁盘空间使用


网友评论