文件名称:RepeatRunner:RepeatRunner 是一个基于 CGL 的程序,它集成了 RepeatMasker 和 BLASTX 以提供识别重复元素的综合方法
文件大小:14.54MB
文件格式:ZIP
更新时间:2024-06-21 10:07:51
Perl
#RepeatRunner RepeatRunner 是一个基于 CGL 的程序,它集成了 RepeatMasker 和 BLASTX 以提供识别重复元素的综合方法。 由于RepeatMasker 通过与已知重复序列的核苷酸文库的相似性来识别重复序列,因此它通常无法识别高度不同的重复序列和重复序列的不同部分,尤其是在重复边缘附近。 为了解决这个问题,RepeatRunner 使用 BLASTX 来搜索重复编码蛋白质(逆转录酶、gag、env 等)的数据库。 由于蛋白质同源性可以在比核苷酸相似性更大的系统发育距离上检测到,因此此 BLASTX 搜索允许 RepeatRunner 识别 RepeatMasker 未检测到的逆转录元件和逆转录病毒的不同蛋白质编码部分。 RepeatRunner 合并它的 BLASTX 和 RepeatMasker 结果以生成一个单一的、综合的基于 XML 的
【文件预览】:
RepeatRunner-master
----README.md(2KB)
----bin()
--------repeat_runner(15KB)
----sample_data()
--------sample.multi.fasta(25KB)
--------sample.out.xml(58KB)
--------te_proteins.fasta.ahd(3.94MB)
--------te_proteins.fasta.bsq(14.76MB)
--------te_proteins.fasta.atb(297KB)
--------dros.sample.genomic.fasta(248KB)
--------te_proteins.fasta(18.83MB)
----config()
--------parameters.cfg(397B)
----lib()
--------PostData.pm(3KB)
--------FastaFile.pm(5KB)
--------Iterator.pm(3KB)
--------repeatmasker()
--------Widget()
--------Iterator()
--------FastaChunk.pm(3KB)
--------PhatHit_utils.pm(6KB)
--------Widget.pm(3KB)
--------XML()
--------Shadower.pm(4KB)
--------FastaChunker.pm(3KB)
--------Fasta.pm(6KB)