基于反相蛋白质阵列谱对十种主要癌症类型进行分类

时间:2024-05-26 06:27:50
【文件属性】:

文件名称:基于反相蛋白质阵列谱对十种主要癌症类型进行分类

文件大小:1.43MB

文件格式:PDF

更新时间:2024-05-26 06:27:50

SQUAMOUS-CELL CARCINOMA; BREAST-CANCER; GENE-EXPRESSION; MALIGNANT

收集癌症基因组的大量数据集需要更有效,更自治的程序来对癌症类型进行分类,并发现一些必需的基因来区分不同的癌症。 因为蛋白质表达比基因表达更稳定,所以我们选择了反相蛋白质阵列(RPPA)数据(一种针对目标蛋白质组学的功能强大且基于抗体的高通量方法)来进行研究。 在这项研究中,我们提出了一个计算框架,该模型使用SMO(顺序最小优化)方法基于RPPA数据将患者样本分类为十种主要的癌症类型。 在训练集上,通过mRMR(最小冗余最大相关特征选择)和IFS(增量特征选择),精心的特征选择程序从187种蛋白质中选择了23种重要蛋白质。 通过使用这23种蛋白质,我们成功地将十种癌症类型进行了分类,其中训练集的MCC(马修斯相关系数)为0.904,通过10倍交叉验证进行了评估,独立测试集的MCC为0.936。 对这23种蛋白质进行了进一步分析。 这些蛋白质中的大多数可以表现出癌症的特征。 例如,Chk2在癌细胞的增殖中起重要作用。 我们对这23种蛋白质的分析证实了这些基因作为癌症分类指标的重要性。 我们还相信,我们的方法和发现可能会揭示不同类型癌症的特定生物标记物的发现。


网友评论