metal-binding-prediction:通过氨基酸序列预测蛋白质中金属结合位点的方法

时间:2024-06-02 00:51:50
【文件属性】:

文件名称:metal-binding-prediction:通过氨基酸序列预测蛋白质中金属结合位点的方法

文件大小:316.17MB

文件格式:ZIP

更新时间:2024-06-02 00:51:50

JupyterNotebook

蛋白质金属结合位点预测 投稿人:田秋,郑子涵,金文浩 生物学意义: 蛋白质及其结构是生命中生物学功能的关键。 通过翻译,核糖体将延长氨基酸序列链,这些氨基酸的物理化学特性及其相互依赖性使一级结构折叠成其复杂的三级结构。 一旦建立了结构,蛋白质结构可能会允许某些离子结合,这可能导致该结构通过构象变化更稳定,或有助于催化。 例如,锌指稳定结构,或血红素基团中离子的必要性,以使血红蛋白转运氧气。 另外,结合位点的序列和结构往往在整个世代中都被保守,并且来自蛋白质数据库(PDB)的大约1/3的蛋白质结构包含金属离子这一事实可能表明它显着干预了蛋白质的行为。 目标 : 我们的兴趣是利用一个突出的神经网络来识别哪些金属与哪个序列结合,以及该金属与哪些氨基酸特异性结合。 我们的目标是将金属分类为准确度为95%的序列。 我们的目标是对哪些氨基酸与F1分数达75%的金属结合进行分类。 概述: [


【文件预览】:
metal-binding-prediction-master
----.gitignore(1KB)
----Zihan()
--------figs()
--------FOFE + CNN.ipynb(123KB)
--------Metal_all_20180116.snappy.parquet(17.17MB)
--------Main_type.ipynb(37KB)
--------Main.ipynb(31KB)
--------dictionaries()
--------fofe.py(517B)
--------main_cnn_fofe.ipynb(40KB)
--------modules.py(17KB)
--------2-gram FOFE.ipynb(59KB)
--------modules_type.py(17KB)
----Workflow_Chart.png(174KB)
----predictor.py(3KB)
----Tian()
--------trainer_struct.png(55KB)
--------model_CBRNN.png(41KB)
--------flowchart.jpg(78KB)
--------main&modules()
--------model_BRNN.png(24KB)
--------flowchart.xml(3KB)
----datasets()
--------Metal_all_20180116.snappy.parquet(17.17MB)
--------Metal_all_20180601.parquet(17.02MB)
--------Metal_all_20180601_predicted.parquet(17.04MB)
----models()
--------NI.json(4KB)
--------ZN.json(4KB)
--------CU.h5(53.64MB)
--------CO.json(4KB)
--------NI.h5(14.86MB)
--------MG.h5(53.64MB)
--------FE.h5(14.86MB)
--------ZN.h5(14.86MB)
--------MG.json(4KB)
--------CA.h5(53.64MB)
--------metal_predict.json(4KB)
--------MN.h5(14.86MB)
--------CO.h5(53.64MB)
--------CA.json(4KB)
--------MN.json(4KB)
--------CU.json(4KB)
--------metal_predict.h5(175KB)
--------FE.json(4KB)
----predictor.ipynb(5KB)
----metal_prediction.ipynb(10KB)
----dictionaries()
--------seq_n_gram_to_vec_dict_w_UX(16.24MB)
--------metal_dict(72B)
--------vocab_dict_fofe(4KB)
--------seqs_dict_onehot(2KB)
----README.md(4KB)
----MBS_prediction.ipynb(15KB)
----modules.py(17KB)
----proteinSequenceEncoder.py(3KB)
----Lowan()
--------sample_AAproperty.xlsx(10KB)
--------AASA_NN.ipynb(152KB)
--------onehotCNN.py(5KB)
--------Metal_all_20180116.snappy.parquet(17.17MB)
----logs()
--------results.txt(2KB)
--------results_sample.txt(2KB)

网友评论