GToTree:系统基因组学的用户友好型工作流程

时间:2024-06-04 02:39:25
【文件属性】:

文件名称:GToTree:系统基因组学的用户友好型工作流程

文件大小:52.87MB

文件格式:ZIP

更新时间:2024-06-04 02:39:25

Shell

GToTree:系统用户化的用户友好型工作流程 是一种易于使用的系统学工作流,旨在使更多的研究人员具有创建系统树的能力。 可找到开放获取的《生物信息学杂志》出版物,并上找到文档和示例。 请参阅安装页面,只需一步就可以启动并运行! conda create -y -n gtotree -c conda-forge -c bioconda -c astrobiomike gtotree GToTree是工作流程的结构化实现,每当我想制作大型系统树时,我都会将其组合在一起。 我所说的大规模是什么意思? 从拥有全部3个域的成熟的生命之树,到新近分离出的基因组,再到例如葡萄球菌的所有可用基因组,无所不包。 它的核心只是吸收基因组,并根据指定的HMM配置文件输出比对和系统树。 但是我认为它的价值来自三个主要方面:1)输入格式方面的灵活性-接收fasta文件,GenBank文件和/或NCBI加入(


【文件预览】:
GToTree-master
----bin()
--------gtt-parse-assembly-summary-file(2KB)
--------gtt-filter-parallel.sh(965B)
--------gtt-ncbi-parallel.sh(11KB)
--------gtt-store-SCG-HMMs(3KB)
--------gtt-pfam-search(54KB)
--------gtt-cat-alignments(3KB)
--------gtt-hmms(1KB)
--------gtt-gen-SCG-HMMs(30KB)
--------gtt-genbank-to-AA-seqs(3KB)
--------gtt-parse-fasta-by-headers(2KB)
--------gtt-fasta-serial.sh(9KB)
--------gtt-genbank-parallel.sh(10KB)
--------gtt-amino-acid-serial.sh(9KB)
--------gtt-parse-gtdb-assembly-summary-file(4KB)
--------gtt-fasta-parallel.sh(8KB)
--------gtt-genbank-serial.sh(11KB)
--------gtt-remove-all-gap-seqs-from-alignment(989B)
--------gtt-gen-itol-map(2KB)
--------gtt-update-ncbi-taxonomy(517B)
--------gtt-ncbi-serial.sh(12KB)
--------gtt-append-fasta-headers(1KB)
--------gtt-genbank-to-fasta(1KB)
--------gtt-get-accessions-from-GTDB(22KB)
--------gtt-swap-ids(1KB)
--------gtt-get-median.sh(355B)
--------gtt-align-and-trim-parallel.sh(3KB)
--------gtt-filter-seqs-by-length(1KB)
--------gtt-reorder-fasta(1KB)
--------gtt-rename-fasta-headers(1KB)
--------gtt-check-wanted-lineage-info(1KB)
--------gtt-amino-acid-parallel.sh(8KB)
--------gtt-clean-after-test.sh(33B)
--------gtt-count-bases-per-seq(944B)
--------GToTree(177KB)
--------gtt-test.sh(1019B)
----ToL_example()
--------results()
--------GToTree_ToL_accessions(27KB)
--------run_log(488B)
----LICENSE(34KB)
----example_run()
--------GCF_000011365.1.gbff(18.86MB)
--------GCA_002271865.1.fa(4.73MB)
--------alteromonas_refseq_accessions.txt(496B)
--------genome_to_id_map.tsv(91B)
--------Alteromonas_example()
--------run_log.txt(1KB)
--------genbank_files.txt(21B)
--------fasta_files.txt(19B)
----.gitignore(10B)
----test_data()
--------GCF_001886455.1_ASM188645v1_protein.faa.gz(811KB)
--------test_run_log.txt(370B)
--------amino_acid_files.txt(81B)
--------fasta_files()
--------ncbi_accessions.txt(119B)
--------GCF_000012505.1_ASM1250v1_genomic.gbff(5.33MB)
--------genome_to_id_map.tsv(159B)
--------pfam_targets.txt(22B)
--------GCA_900473895.1_N32_genomic.gbff.gz(911KB)
--------genbank_files.txt(75B)
--------GCF_000020585.3_ASM2058v3_protein.faa(1.46MB)
--------fasta_files.txt(102B)
----hmm_sets()
--------Chlamydiae.hmm(27.61MB)
--------Cyanobacteria.hmm(20.86MB)
--------Actinobacteria.hmm(10.32MB)
--------Firmicutes.hmm(8.48MB)
--------Bacteria.hmm(4.76MB)
--------Epsilonproteobacteria.hmm(22.44MB)
--------Alphaproteobacteria.hmm(8.27MB)
--------Archaea.hmm(5.98MB)
--------Gammaproteobacteria.hmm(13.63MB)
--------Proteobacteria.hmm(8.86MB)
--------Bacteroidetes.hmm(6.19MB)
--------Universal_Hug_et_al.hmm(939KB)
--------Betaproteobacteria.hmm(16.74MB)
--------Bacteria_and_Archaea.hmm(1.79MB)
--------Tenericutes.hmm(7.68MB)
--------hmm_sources_and_info.tsv(43KB)
----README.md(6KB)

网友评论