pacmonstr:长读序列数据的串联重复检测

时间:2024-05-25 18:40:20
【文件属性】:

文件名称:pacmonstr:长读序列数据的串联重复检测

文件大小:779KB

文件格式:ZIP

更新时间:2024-05-25 18:40:20

Python

PacmonsTR 长读序列数据的串联重复检测 管道按以下步骤工作: 初始运行将获取一个比对文件(将长读与参考进行比对,例如hg19)和一个参考串联重复表作为INPUT,并生成一个输出文件,该文件的估计长号重复读入区域中的预期tanderm重复区域为该数字的期望值串联重复元素的数量,估计串联重复中的结构变异区域。 从步骤A生成的输出文件(在处理之后)用于聚类。 聚类使用基于GMM的聚类方法,该方法使用AIC作为模型选择标准,并进行c分离。 基于聚类标准进行等位基因调用(纯合子/杂合子),并输出两个文件。 一个文件包含所有调用,另一个文件包含每个群集的读取数据。 获取每个群集的读取数据,并生成一个共识序列。 可以将共有序列作为步骤A的输入,并且可以执行TR多重性的重新估计。 要求 PacmonSTR具有以下依赖性: Blasr:PacmonSTR假定有关Blasr生成的.m5格式的


网友评论