智能变量过滤

时间:2024-03-01 19:47:21
【文件属性】:

文件名称:智能变量过滤

文件大小:2.13MB

文件格式:ZIP

更新时间:2024-03-01 19:47:21

Python

总览 智能变异过滤(SVF)是一种开放源代码Python框架,用于使用机器学习进行基因组变异过滤。 变体过滤过程包括选择高度可信的变体并删除被错误调用的变体。 假设这两者的准确性将对整体质量产生重大影响,则二级基因组DNA分析主要针对比对和变异调用。 尽管变体过滤步骤可以显着提高变体调用的精度,但在更深入的测试中大部分都没有进行。 智能变异过滤使用经过训练的机器学习算法,该算法根据现有的瓶中基因组(GIAB)变异(称为样本(HG001-HG005))的特征进行训练,以执行变异过滤(分类)。 SVF可以在github上获得,也可以作为Seven Bridges Public App画廊上的Public工具获得。 它是完全开源的,任何一方或任何条件均可免费使用。 在深入的三阶段测试中获得的比较结果证明,其性能优于大多数二级DNA分析中当前使用的解决方案。 智能变量过滤可将被称为SNV的精度


【文件预览】:
smart-variant-filtering-master
----svf_train.py(8KB)
----models()
--------model_6_features_wgs_indel.sav(217KB)
--------model_6_features_wgs_snv.sav(272KB)
--------model_7_features_wes_indel.sav(220KB)
--------model_7_features_wes_snv.sav(306KB)
----cwl()
--------train_apply_test_cwl.json(677KB)
--------svf_cwl.json(52KB)
--------prepare_features_cwl.json(506KB)
--------apply_filter_cwl.json(145KB)
----svf_apply.py(11KB)
----CONTRIBUTING.md(3KB)
----svf_test.py(9KB)
----test()
--------testing_parallel.py(2KB)
--------make_medium_test.sh(139B)
----LICENCE(1KB)
----README.md(8KB)
----data()
--------benchmarks()
--------wes()

网友评论