pacmonstr:长读序列数据的串联重复检测下载

【文件属性】：

文件名称：pacmonstr:长读序列数据的串联重复检测

文件大小：779KB

文件格式：ZIP

更新时间：2024-05-25 18:40:20

Python

PacmonsTR 长读序列数据的串联重复检测管道按以下步骤工作：初始运行将获取一个比对文件（将长读与参考进行比对，例如hg19）和一个参考串联重复表作为INPUT，并生成一个输出文件，该文件的估计长号重复读入区域中的预期tanderm重复区域为该数字的期望值串联重复元素的数量，估计串联重复中的结构变异区域。从步骤A生成的输出文件（在处理之后）用于聚类。聚类使用基于GMM的聚类方法，该方法使用AIC作为模型选择标准，并进行c分离。基于聚类标准进行等位基因调用（纯合子/杂合子），并输出两个文件。一个文件包含所有调用，另一个文件包含每个群集的读取数据。获取每个群集的读取数据，并生成一个共识序列。可以将共有序列作为步骤A的输入，并且可以执行TR多重性的重新估计。要求 PacmonSTR具有以下依赖性： Blasr：PacmonSTR假定有关Blasr生成的.m5格式的

立即下载

秒客网

pacmonstr:长读序列数据的串联重复检测

网友评论

相关文章