文件名称:fastPPCA:基因型数据的概率PCA模型的快速EM算法
文件大小:2.13MB
文件格式:ZIP
更新时间:2024-05-31 00:24:55
machine-learning genomics pca C++
可扩展且灵活的概率PCA用于大规模遗传变异数据 笔记: 现在不维护该存储库。 请检查 我们提出了一种可扩展且精确的算法来计算遗传变异数据的主要成分。 我们的方法基于先前提出的概率PCA,PPCA的潜在变量模型(Roweis,1999; Tipping和Bishop,1999),其中PCA出现在小方差极限内。 潜在变量模型公式化导致了一种迭代EM算法,该算法用于计算具有时间复杂度O(KMN)的主成分,以每次迭代计算N个个体和M个SNP上的K个主成分。 入门 这些说明将为您提供在本地计算机上运行并运行的项目的副本,以进行开发和测试。 先决条件 在Linux机器上,需要以下软件包才能编译和使用软件包。 g++ cmake make 正在安装 安装FastPPCA非常简单。 只需在linux机器上发出以下命令 git clone https://github.com/aman71197/fa