Assembly-Dereplicator:用于从一组程序集中删除冗余基因组的工具

时间:2024-03-30 11:51:30
【文件属性】:

文件名称:Assembly-Dereplicator:用于从一组程序集中删除冗余基因组的工具

文件大小:241KB

文件格式:ZIP

更新时间:2024-03-30 11:51:30

Python

程序集去复制器 Ryan R.Wick 1和Kathryn E.Holt 1,2 1.莫纳什大学*临床学院传染病系,澳大利亚维多利亚州墨尔本3004 2.英国伦敦卫生与热带医学学院,伦敦WC1E 7HT,英国 目录 介绍 此存储库包含一个独立的Python脚本( ),用于解决我偶尔遇到的一个问题:重复复制一组细菌基因组程序集。 去复制意味着删除具有足够近亲(由距离阈值定义)的组件,从而在组件更独特的情况下得到较小的集合。 例如,假设您有一个特定分类单元的10000个基因组装配体,并且想要对其进行一些分析,也许是构建一个泛基因组。 您知道这组中存在冗余,因为某些基因组来自暴发并且彼此几乎相同。 因此,您可以对所有10000个程序集进行分析,而无需将它们重复复制到较小的集合中(例如,删除几乎相同的冗余基因组),这样您的分析将更快。 要求 您需要Python 3.5或更高版本才能运行der


【文件预览】:
Assembly-Dereplicator-master
----.travis.yml(238B)
----.coveragerc(20B)
----images()
--------trees.png(44KB)
----test()
--------compression()
--------test_dereplicator.py(6KB)
--------other()
--------README.md(496B)
--------assemblies()
----LICENSE(34KB)
----dereplicator.py(15KB)
----.gitignore(1KB)
----README.md(8KB)

网友评论