NVDT:一种从基因序列预测蛋白质与蛋白质相互作用和非相互作用的新计算方法

时间:2024-03-28 07:23:46
【文件属性】:

文件名称:NVDT:一种从基因序列预测蛋白质与蛋白质相互作用和非相互作用的新计算方法

文件大小:75.6MB

文件格式:ZIP

更新时间:2024-03-28 07:23:46

MATLAB

NVDT 一种新的计算方法,用于从基因序列预测蛋白质与蛋白质的相互作用和非相互作用。 第1部分:数据集 ---每个物种的正负样本。 每个.xlsx文件都有两列和几行。 每行代表一个蛋白质对(阳性样本是相互作用的蛋白质对,阴性样本是非相互作用的蛋白质对) (1) Real-Datasets :从DIP数据库中收集正样本,从Negatome数据库中收集负样本。 这里有两种,H。sapiens和M. musculus。 阳性样本数据集文件的名称应为物种名称,后跟“ Positive_Real”(例如M. musculus_Positive_Real.xlsx)。 阴性样品数据集文件的名称应为物种名称,后跟“ Negative_Real”(例如M. musculus_Negative_Real.xlsx)。 (2) Constructed-Datasets :从DIP数据库中收集阳性样品,并通


【文件预览】:
NVDT-master
----README.md(4KB)
----Part1-Datasets()
--------Constructed-Datasets()
--------Real-Datasets()
----Part4-Training model and prediction()
--------RF_classifier.ipynb(4KB)
----Part5-Model evaluation()
--------prediction_index.m(951B)
--------value.m(415B)
--------AUC_value.m(667B)
----Part2-Feature extraction and standardization()
--------features_dinucleotide.m(6KB)
--------Feature_extraction.m(2KB)
--------features_triplet_nucleotide.m(11KB)
--------Feature_standardize.ipynb(2KB)
--------features_nucleotide.m(1KB)
----Part3-Training datasets and testing datasets()
--------Input files of support vector machine classifier()
--------Input files of random forest classifier()

网友评论