Balrog:通过基因表达的细菌注释

时间:2024-06-15 07:25:37
【文件属性】:

文件名称:Balrog:通过基因表达的细菌注释

文件大小:151.77MB

文件格式:ZIP

更新时间:2024-06-15 07:25:37

JupyterNotebook

通过基因表达的细菌注释 概述 Balrog是基于时间卷积网络的原核基因发现者。 我们采用了一种数据驱动的方法来寻找原核基因,这取决于已经测序的基因组的庞大而多样的集合。 通过在来自许多不同物种的蛋白质序列上训练细菌基因的单一通用模型,我们能够匹配当前基因发现者的敏感性,同时减少了基因预测的总数。 Balrog不需要重新安装任何新的基因组。 预印本可在bioRxiv上。 入门 单击上方的“在Colab中打开”按钮,或开始。 按下每个单元格左侧的播放按钮以运行它。 或者,按住shift或Ctrl并按Enter键以运行单元格。 双击单元格的顶部以检查其中的代码并进行更改。 双击单元格的右侧以隐藏代码。 玩得开心! 由于Balrog使用复杂的基因模型并使用mmseqs2执行基于比对的搜索,因此每个基因组需要约10-15分钟来处理。 如果遇到问题或需要Balrog的命令行版本,请随时打开Git


【文件预览】:
Balrog-master
----notebooks()
--------Balrog_0.3.2.ipynb(44KB)
----hubconf.py(7KB)
----images()
--------balrog.jpg(565KB)
----kmer_filter()
--------genexa_10mer_thresh2_minusARF_all.tar.gz(59.76MB)
----protein_filter()
--------genexa_genes.tar.gz(91.03MB)
----weights()
--------geneTCN.pt(333KB)
--------tisTCN.pt(150KB)
----LICENSE(1KB)
----README.md(2KB)

网友评论