文件名称:variant-calling-pipeline:使用freebayes和bcftools对排序的bam文件进行变体调用的管道
文件大小:77.95MB
文件格式:ZIP
更新时间:2024-04-17 19:49:35
HTML
介绍 这是一个管道的存储库,该管道是为对的降采样数据集进行变体调用而编写的。 下采样的数据集由仅映射到20号染色体的读段组成。 管道使用两个工具调用变量,稍后将比较它们的最终输出: bcftools FreeBayes 两种工具的输出均保存到单独的文件中。 在这一点上,管道分叉成两个平行的轨道,一个轨道用于每个工具的输出。 以下说明适用于两条轨道: 调用变体后,将根据变体质量和变体现场的深度来过滤变体(来自两个工具)。 此外,它们被过滤为仅包含SNP,而没有其他类型的变异,如插入缺失。 然后,使用snpEff注释已过滤的变体。 带注释的变体将转换为bgzipped格式,并使用bcftools索引。 然后,两个轨道的最终带注释的输出与bcftools isec相交,以获取共享的带注释的snp站点。 由于目录中已经存在“ Snakefile”,因此可以使用Snakemake
【文件预览】:
variant-calling-pipeline-master
----NA12878.hiseq.wgs_chr20_2mb.30xPE_freebayes_snpEff.vcf.gz.csi(1KB)
----NA12878.hiseq.wgs_chr20_2mb.30xPE_bcftools_snpEff.vcf.gz.csi(1KB)
----NA12878.hiseq.wgs_chr20_2mb.30xPE_freebayes_called.vcf(1.63MB)
----rulegraph.png(30KB)
----NA12878.hiseq.wgs_chr20_2mb.30xPE.sorted.bam.bai(1.39MB)
----NA12878.hiseq.wgs_chr20_2mb.30xPE_freebayes_called_filtered.vcf(1.15MB)
----Snakefile(4KB)
----NA12878.hiseq.wgs_chr20_2mb.30xPE_bcftools_snpEff.vcf(1.17MB)
----NA12878.hiseq.wgs_chr20_bcftools_snpEff.genes.txt(8KB)
----NA12878.hiseq.wgs_chr20_2mb.30xPE_bcftools_snpEff.vcf.gz(166KB)
----consensus()
--------README.txt(892B)
--------0002.bcf.csi(1KB)
--------0001.bcf(18KB)
--------0000.bcf.csi(508B)
--------0001.bcf.csi(644B)
--------0003.bcf.csi(1KB)
--------0002.bcf(295KB)
--------0000.bcf(14KB)
--------0003.bcf(161KB)
----NA12878.hiseq.wgs_chr20_freebayes_snpEff.genes.txt(8KB)
----NA12878.hiseq.wgs_chr20_2mb.30xPE_freebayes_snpEff.html(163KB)
----NA12878.hiseq.wgs_chr20_2mb.30xPE_bcftools_snpEff.genes.txt(8KB)
----NA12878.hiseq.wgs_chr20_2mb.30xPE_bcftools_snpEff.html(176KB)
----NA12878.hiseq.wgs_chr20_2mb.30xPE_freebayes_snpEff.vcf.gz(309KB)
----NA12878.hiseq.wgs_chr20_2mb.30xPE.sorted.bam(36.21MB)
----NA12878.hiseq.wgs_chr20_2mb.30xPE_freebayes_snpEff.genes.txt(8KB)
----dag.png(27KB)
----NA12878.hiseq.wgs_chr20_2mb.30xPE.bcf(38.6MB)
----NA12878.hiseq.wgs_chr20_2mb.30xPE_bcftools_called_filtered.vcf(464KB)
----README.md(10KB)
----NA12878.hiseq.wgs_chr20_2mb.30xPE_bcftools_called.bcf(124KB)
----NA12878.hiseq.wgs_chr20_2mb.30xPE_freebayes_snpEff.vcf(1.82MB)
----qc()
--------NA12878.hiseq.wgs_chr20_2mb.30xPE.fastq_1_fastqc.zip(370KB)
--------NA12878.hiseq.wgs_chr20_2mb.30xPE.fastq_1_fastqc.html(610KB)
--------NA12878.hiseq.wgs_chr20_2mb.30xPE.fastq_2_fastqc.zip(403KB)
--------NA12878.hiseq.wgs_chr20_2mb.30xPE.fastq_2_fastqc.html(627KB)