文件名称:用于 RNA 灵活性分析的基于加权持久同源性的机器学习-研究论文
文件大小:779KB
文件格式:PDF
更新时间:2024-06-30 07:51:26
RNA chain B-factor
随着生物分子柔性在生物分子动力学和功能分析中的重要意义,发展了各种实验方法和理论模型。 在实验上,Debye-Waller 因子,也称为 B 因子,测量原子均方位移,通常被认为是衡量灵活性的重要指标。 理论上,弹性网络模型、高斯网络模型、柔性-刚性模型和其他计算模型通过揭示生物分子内部拓扑结构被提出用于柔性分析。 最近,提出了一种基于拓扑的机器学习模型。 通过使用持久同源性的特征,该模型在蛋白质 B 因子预测中实现了显着的高精度。 受其成功的启发,我们提出了基于加权持久同源性 (WPH) 的机器学习 (WPHML) 模型用于 RNA 灵活性分析。 我们的 WPH 是一个新提出的模型,它使用权重函数将物理、化学和生物信息整合到拓扑测量中。 特别是我们使用局部持久同源性(LPH),它不是考虑整个RNA结构的拓扑,而是关注局部区域的拓扑信息。 我们的 WPHML 模型在完善的 RNA 数据集上得到验证,数值实验表明我们的模型可以实现高达 0.5822 的 Pearson 相关系数。 与之前基于序列信息的学习模型的比较表明,在我们当前的模型中,准确率持续提高了至少 10%。