通过正则化非负矩阵分解来预测稀疏标签PPI网络中的蛋白质功能特性

时间:2024-04-24 09:28:22
【文件属性】:

文件名称:通过正则化非负矩阵分解来预测稀疏标签PPI网络中的蛋白质功能特性

文件大小:384KB

文件格式:PDF

更新时间:2024-04-24 09:28:22

研究论文

背景:预测蛋白质在蛋白质间相互作用(PPI)网络中的功能特性提出了一个具有挑战性的问题,并在计算生物学中具有重要意义。 利用属性特征和相关信息共同对PPI网络中的相关蛋白质进行分类的集体分类(CC)已被证明是解决此问题的有力方法。 当给定具有大量标记数据的全标记PPI网络时,启用CC通常会提高准确性。 但是,在许多现实世界的PPI网络中可能很难获得这样的标记,在这些网络中,通常只有有限数量的标记蛋白质,并且有大量未标记蛋白质。 在这种情况下,大多数未标记的蛋白质可能不会与标记的蛋白质连接,因此无法从本地网络连接中有效地获得监管知识。 结果,在稀疏标记的PPI网络中学习CC模型可能会导致性能下降。 结果:我们研究了一种潜在图方法,该方法通过利用各种潜在连接来寻找整合潜在图,并明智地整合所研究的连接,以链接(分离)具有相似(不同)功能的蛋白质。 我们开发了一种用于CC的正则化非负矩阵分解(RNMF)算法,以通过利用此问题集中可用的各种数据源(包括属性特征,潜图和未标记的数据信息)来进行蛋白质功能特性预测。 在RNMF中,将标签矩阵分解项和网络正则化项合并到非负矩阵分解(NMF)目标函数中,以寻求尊重网络结构和标签信息以进行分类预测的矩阵分解。 结论:KDD Cup任务预测蛋白质在酵母基因中的定位和功能的实验结果证明了所提出的RNMF方法在预测蛋白质特性方面的有效性。 在比较中,我们发现该新方法的性能优于其他比较的CC算法,尤其是在缺乏标记蛋白的情况下。


网友评论

相关文章