文件名称:Coconut-TMAP-SVM
文件大小:46.95MB
文件格式:ZIP
更新时间:2024-08-13 15:35:25
HTML
COCONUT数据库中天然产物的化学空间图和机器学习分类 按植物(绿色)、真菌(蓝色)或细菌(橙色)来源着色。 Jupyter 笔记本说明: 1. 属性计算 下载了 2021 年 2 月版的 。 提取了 60,171 个具有出版来源并注释为真菌、细菌或植物 NPs 的 COCONUT 条目。 从 DB 中提取碳数、氧数和氮数、原子总数、键数。 MW、sp3 C 的分数、氢键供体 (HBD) 和受体 (HBA) 计数、使用 Crippen 方法计算的 logP (AlogP) 以及使用计算的拓扑极性表面积 (TPSA)。 使用来鉴定糖基化和/或肽结构。 违反一项以上利平斯基规则的分子被标记为非利平斯基。 是在 1024 个维度上计算的。 2. MAP4 SVM 分类器 椰子 SUBSET 条目被分配到训练或测试集,随机分割为 50%。 SVM 使用训练集的 MAP4 指纹进行训练,并使用自
【文件预览】:
Coconut-TMAP-SVM-main
----.gitignore(1KB)
----README.md(4KB)
----MAP4_curatedCOCONUT_TMAP_MicrobialAndPlants_b.html(17.48MB)
----02_TMAP.ipynb(17KB)
----environment.yml(4KB)
----LICENSE(1KB)
----03_MAP4SVM.ipynb(17KB)
----MAP4_curatedCOCONUT_TMAP_MicrobialAndPlants.html(17.43MB)
----01-data_extr_property_calc.ipynb(18KB)
----05_classifier_test.ipynb(19KB)
----04_comparisonSMVs.ipynb(100KB)
----06_further_analyisis.ipynb(27KB)
----data()
--------list_taxa.txt(28KB)
--------other_taxa.xlsx(32.09MB)
--------COCONUT_DB.smi.gz(8.66MB)