SeqPig:使用 Apache Pig 处理大型测序数据集!-开源

时间:2024-07-28 08:50:32
【文件属性】:

文件名称:SeqPig:使用 Apache Pig 处理大型测序数据集!-开源

文件大小:643KB

文件格式:GZ

更新时间:2024-07-28 08:50:32

开源软件

SeqPig 是 Apache Pig 的一个库,用于对大型测序数据集进行分布式分析。 它为测序数据常用的文件格式提供导入和导出功能,以及一组 Pig 用户定义函数 (UDF),以帮助处理对齐和未对齐的序列数据。 目前 SeqPig 支持 BAM/SAM、FastQ 和 Qseq 输入和输出。 有关更多信息,请参阅 http://seqpig.sourceforge.net/ 上的手册


【文件预览】:
seqpig_0.6
----README.txt(1KB)
----bin()
--------prepareBamOutput.sh(1KB)
--------prepareSamOutput.sh(1KB)
--------prepareSamInput.sh(647B)
--------seqpigEnv.sh(798B)
--------seqpig(680B)
--------prepareBamInput.sh(711B)
----pom.xml(4KB)
----tools()
--------plot_basequal_stats.R(494B)
--------basequal_stats2matrix.pl(2KB)
--------transform_fasta.pl(1KB)
----data()
--------input.bam.asciiheader(16KB)
--------input.qseq(12KB)
--------input.fq(12KB)
--------input.sam(21KB)
--------bgzf-terminator.bin(28B)
--------input.bam(6KB)
----test()
--------test_all.sh(11KB)
----python()
--------SAMReadStreaming.py(4KB)
----src()
--------main()
----CHANGELOG.txt(1KB)
----perl()
--------Pileup.pl(5KB)
--------GetReferenceBases.pl(3KB)
----doc()
--------seqpig_reference.tex(31KB)
--------seqpig_manual.tex(3KB)
--------basequal_visible_cropped.png(111KB)
--------seqpig_examples.tex(25KB)
--------Makefile(863B)
--------seqpig_installation.tex(7KB)
----.gitignore(164B)
----lib()
--------seal-0.4.0-with-hadoop-bam-7.4.0.jar(456KB)
----scripts()
--------base_stats_alternative.pig(2KB)
--------python_coverage.pig(646B)
--------base_stats_unaligned.pig(1024B)
--------extract_fastq.pig(115B)
--------qual_stats_unaligned.pig(720B)
--------basequal_stats.pig(1KB)
--------base_stats.pig(1KB)
--------basefreq.pig(1KB)
--------clip_reads.pig(970B)
--------filter_mappability.pig(1KB)
--------pileup.pig(2KB)
--------sort_bam.pig(1KB)
--------read_stats.pig(611B)
--------filter_defs.pig(973B)
--------fast_fastqc.pig(3KB)

网友评论