对于利用pca 和 cca 进行fmri激活区识别的理解

时间:2022-05-03 16:56:48

1.pca

  抛开fmri研究这个范畴,我们有一个超长向量,这个超长向量在fmri研究中,就是体素数据。向量中的每个数值,都代表在相应坐标轴下的坐标值。这些坐标轴所组成的坐标系,其实是标准单位坐标系。向量如果乘以另外一个转换矩阵,我们可以得到这个向量在新坐标系下的坐标值。变换之后,新的向量维数就变了,一般是降低了,如果我们是以降维为考虑目标。如果把向量进行推广,成为矩阵,那么这个矩阵的每一列都代表一个向量,在具体的研究中,也就是一次采样数据。矩阵有多少列,就代表有多少次采样。在fmri研究中,如果我们哪timepoints作为样本数,那么每次采样就是大脑的n个体素,利用pca就是对这n个体素进行分解、提炼组合,去除冗余,得到较低维数的m个成分。一般以这m个成分中的第一个成分,也就是能量最大的成分做激活检测。

 

前面提到的体素依赖方法只适用于时间参数已明确知道的任务设计的实验数据分析,对于未知刺激任务时间的实验,如睡眠、癫痫放电等自发生理活动的数据分析时,将无法应用。这类实验的数据可采用主成分分析(Principal Component Analysis, PCA)和独立成分分析(Independent Component Analysis, ICA)等多变量分析,将fMRI数据分解成正交的空间成分或具有不同时间过程的独立的成分,提取包含于时间序列图像中的功能信息,不需要任何血流动力学响应的时间过程数据及皮层幅度的先验假设,其实验设计也就无需依赖任何实验模型(如组块或事件相关)。 故体素依赖的单变量方法又称模式驱动(paradigm driven),相应多变量分析称数据驱动(data driven)分析模式。PCA通过检测随实验条件变化的开始一部分空间特征模式的时间形式,确定与反应有关的功能系统的分布特征,侧重于描述功能系统的分布而不是定位,用于探索各功能区之间的相互联系。ICA通过提取一系列空间独立的空间模型,相比PCA更侧重空间定位,最适合于探索一个新假说模型的发生而非已知假设的检验。如fMRI对药物作用、睡眠、饥饿感的中枢机制研究等 ,近来有把时间聚类分析(Temporal Clustering Analysis) 用于无EEG联合的癫痫灶定位研究中 。PCA和ICA的缺点是对于大部分的不同成分的数据相关性难以给出一个生理解释。

 

2.cca

  如果是拿体素时间序列和参考实验刺激时序波形做做相关分析,这就是模型驱动分析。

  如果是拿体素时间序列和体素自身的时间序列做相关分析,这就是数据驱动分析。