R语言进行方差分析

时间:2021-05-17 02:12:33

一、单因子方差分析(one-way ANOVA

1)建模:

我们采用multcomp包中的cholesterol数据集作为例子,其中response为响应变量,trt为预测变量,这个处理中有五种水平。从下面的箱形图中可观察到处理的不同水平对于响应变量的影响。再用aov函数建立单因子方差模型,从结果的P值可看到各组均值有显著不同。

1 aggregate(response, by=list(trt), FUN=mean)
2 bwplot(response~trt)
3 model=aov(response~trt)
4 summary(model)
R语言进行方差分析

2)多重比较:

方差分析只告诉我们这五组之间是不同的,但没有告诉我们哪两组之间有明显差别,此时需要使用TukeyHSD函数进行均值的多重比较分析,从结果中观察到有三个两两比较是不显著的。

1 (result=TukeyHSD(model))
2 plot(result)
R语言进行方差分析

3)假设检验:

方差分析需要一定的假设,即数据集应该符合正态和同方差,我们分别用下面的函数来进行检验,从P值观察到这两个假设是符合的。对于不符合假设的情况,我们就要用到非参数方法,例如Kruskal-Wallis秩和检验

1 shapiro.test(response)
2 bartlett.test(response~trt)

 

二、双因子方差分析(Two-way Factorial ANOVA

我们用ToothGrowth数据集来举例双因子方差分析。其中supp和dose是预测变量,len是响应变量。我们仍然使用aov进行建模,然后使用HH包的绘图函数来展现双因子交互效果图

1 fit <- aov(len ~ supp*dose)
2 library(HH)
3 interaction2wt(len~supp*dose)
R语言进行方差分析

要注意在下面的情况下因子的先后顺序是有讲究的:

  • 第一种情况是多因子非平衡情况下,此时重要的因子应该放在前面,
  • 第二是在在有协变量情况下,此时协变量放在前面,然后是主因子和交互因子

三、重复测量方差分析

在重复测量的方差分析中,实验对象被测量多次,所以会存在组内因子,组内因子要以下面的形式特别标明出来,其中B是组间因子,W是组内因子,subject是实验对象的ID,

1 model=aov(Y ~ B * W + Error(Subject/W))

上述方法的前提是对应组内因子不同水平的数据是等方差的,当传统方法的假设得不到满足时,则应用lme4包中lmer函数,利用混合效应模型来解决问题。