文件名称:Molecules_Dataset_Collection:收集分子数据集以验证性质推论
文件大小:63.07MB
文件格式:ZIP
更新时间:2024-06-01 03:49:13
machine-learning molecule inference dataset properties
收集分子和性质的数据集 :wrapped_gift: :grinning_face_with_smiling_eyes: 它是什么? 受到启发 分子(SMILES)和理化特性数据集的选择 目标? 数据集中的SMILES已通过 将数据集聚集在同一位置。 他们都在这里! 使用它通过提出的各种机器学习模型来验证分子性质的推论 方法? 遵循方法对所有数据集进行正则化,以输出异构,规范和kekulise SMILES( ) 如果未成功对SMILES进行正则化,则与原始数据集相比,将空格替换为SMILES 但是这些数据集是什么? 量子力学: QM9 物理化学: ESOL , FreeSolv ,亲脂性 生物物理学: PCBA , HIV , BACE 生理学:BBBP,Tox21,ToxCast,SIDER,ClinTox 来自 ,这是它们的简短描述以及方括号之间的推断任务(对于此处报告的正规数据集): QM9 :DFT建模的小分子的几何,能量,电子和热力学性质[分
【文件预览】:
Molecules_Dataset_Collection-master
----originals()
--------HIV.csv(2.05MB)
--------bace.csv(3.72MB)
--------sider.csv(179KB)
--------pcba.csv.tar.gz(14.75MB)
--------clintox.csv(93KB)
--------gdb9.tar.gz(12.32MB)
--------README.md(196B)
--------FreeSolv_SAMPL.csv(31KB)
--------Lipophilicity.csv(276KB)
--------tox21.csv(513KB)
--------toxcast_data.csv(9.8MB)
--------BBBP.csv(145KB)
--------HIV_w_emptylines.csv(2.09MB)
--------ESOL_delaney-processed.csv(94KB)
----LICENSE(1KB)
----latest()
--------HIV.csv(2.68MB)
--------bace.csv(4.32MB)
--------sider.csv(191KB)
--------pcba.csv.tar.gz(17.53MB)
--------clintox.csv(109KB)
--------README.md(60B)
--------FreeSolv_SAMPL.csv(37KB)
--------gdb9_prop_smiles.csv.tar.gz(13.09MB)
--------Lipophilicity.csv(353KB)
--------tox21.csv(750KB)
--------toxcast_data.csv(9.87MB)
--------BBBP.csv(161KB)
--------ESOL_delaney-processed.csv(100KB)
----README.md(3KB)