文件名称:perf:PERF是详尽的重复查找器
文件大小:16.09MB
文件格式:ZIP
更新时间:2024-05-18 02:25:53
genomics genome simple repeats ssr
PERF 介绍 PERF是为从DNA序列快速准确识别微卫星而开发的Python软件包。 微卫星或简单序列重复(SSR)是1-6nt基序的短串联重复。 它们存在于所有基因组中,具有广泛的用途和功能作用。 现有的SSR识别工具在速度,全面性,准确性,易用性,灵活性和内存使用方面有一个或多个警告。 PERF旨在解决所有这些问题。 PERF是递归的首字母缩写,代表“ PERF是穷举重复查找器”。 它与Python 2(在Python 2.7上测试)和3(在Python 3.5上测试)兼容。 它的主要特征是: 快速运行时间。 例如,从整个人类基因组中鉴定所有SSR所需的时间不到7分钟。 使用可以将速度进一步提高约3至4倍(使用PyPy v5.8.0在不到2分钟的时间内完成人类基因组) 线性时间和空间复杂度(O(n)) 识别完美的SSR 100%准确而全面-不漏掉任何重复项或不选择任何不正确
【文件预览】:
perf-master
----MANIFEST.in(128B)
----README.rst(4KB)
----utils()
--------repeat_generator.py(3KB)
----pylint.rc(13KB)
----requirements.txt(45B)
----LICENSE(1KB)
----setup.cfg(40B)
----PERF()
--------fastq_utils.py(9KB)
--------utils.py(6KB)
--------lib()
--------__init__.py(23B)
--------analyse.py(11KB)
--------annotation.py(14KB)
--------all_repeats_1-6nt.txt(91KB)
--------core.py(8KB)
--------rep_utils.py(10KB)
----setup.py(594B)
----README.md(21KB)
----test_data()
--------test_input.fastq_perf.html(2.96MB)
--------test_input.fastq_perf.tsv(42KB)
--------test.fastq_perf.html(2.96MB)
--------test_input_perf.html(2.93MB)
--------test_input.fa(6.25MB)
--------unit_options.txt(25B)
--------repeat_options.txt(56B)
--------test_input_perf.tsv(943KB)
--------test_input.fastq.gz(10.82MB)
----.gitignore(221B)