文件名称:使用内核方法进行DNA序列分类:内核方法的机器学习(MVA 2021)-使用内核方法和ML算法从头开始进行DNA序列分类
文件大小:841KB
文件格式:ZIP
更新时间:2024-03-24 00:46:40
machine-learning kernel svm dna sequence
核方法对DNA序列的分类 使用内核方法的机器学习(MVA 2021)-使用内核方法和ML算法从头开始进行DNA序列分类 转录因子(TFs)是调节蛋白,可结合基因组中的特定序列基序来激活或抑制靶基因的转录。 可以使用一些实验技术对全基因组蛋白-DNA结合图谱进行分析,因此对于感兴趣的TF,所有基因组可以分为两类:结合的或未结合的。 在这个挑战中,我们将使用与三个不同TF对应的三个数据集,并预测一个序列是否与TF绑定。
【文件预览】:
DNA-sequence-classification-with-kernel-methods-master
----sandbox.py(2KB)
----README.md(674B)
----kernels.py(2KB)
----useful_links.txt(582B)
----classifiers()
--------svm.py(380B)
--------ridge_regression.py(1KB)
--------logistic_regression.py(287B)
----data()
--------Xte0.csv(103KB)
--------Xte2_mat100.csv(2.38MB)
--------Xte0_mat100.csv(2.38MB)
--------Ytr2.csv(14KB)
--------Xtr0.csv(208KB)
--------Xtr0_mat100.csv(4.77MB)
--------Ytr1.csv(14KB)
--------Xte1_mat100.csv(2.38MB)
--------Xte2.csv(104KB)
--------Xtr1.csv(209KB)
--------Xtr1_mat100.csv(4.77MB)
--------Ytr0.csv(13KB)
--------Xtr2_mat100.csv(4.77MB)
--------Xte1.csv(104KB)
--------Xtr2.csv(209KB)