一、原理简介
一个复杂的事物,其中往往有许多因素互相制约又互相依存。方差分析的目的是通过数据分析找出对该事物有显著影响的因素,各因素之间的交互作用,以及显著影响因素的最佳水平等。
一项试验有多个影响因素,如果只有一个在发生变化,则称单因素分析。假设某一试验有s个不同条件,则在每个条件(或称水平)下进行试验,可得s个总体,分别记为,各总体的平均数表示为,各总体的方差表示为。现在,在这s个总体服从正态分布且方差相等的情况下检验各总体的平均数是否相等。当假设成立时,认为因素对试验结果之间没有显著影响。
二、函数anova1
matlab通过函数anova1来实现单因素方差分析。
函数p=anova1(X)说明:
比较样本m n的矩阵X中两列或多列数据的均值。若p值接近0,则认为列均值存在差异。P值一般小于0.05或0.01,此时拒绝原假设。
anova1函数生成两个图形:
1)第一个图为标准方差分析表,分为六列:
第一列:显示误差来源;
第二列:显示每一误差来源的平方和(ss);
第三列:显示与每一误差来源相关的*度(df);
第四列:显示均值平方和;
第五列:显示F统计量;
第六列:显示p值.
2)第二个图显示X的每一列的箱形图。箱形图中心线上较大的差异对应于较大的F值和较小的P值。
三、案例分析
设有三台机器,用来生产规格相同的铝合金薄板.取样,测量薄板的厚度精确至千分之一厘米.得到结果如表一所示:
表一 铝合金板的厚度
机器I |
机器II |
机器III |
0.236 |
0.257 |
0.258 |
0.238 |
0.253 |
0.264 |
0.248 |
0.255 |
0.259 |
0.245 |
0.254 |
0.267 |
0.243 |
0.261 |
0.262 |
解:需要检验假设
(原假设) 表示平均值
(备择假设) 不相等
x= [0.236,0.257,0.258;
0.238,0.253,0.264;
0.248,0.255,0.259;
0.245,0.254,0.267;
0.243,0.261,0.262];
p=anova1(x)
运行结果如下:
p值为1.3431e-005,因此在水平为0.05下拒绝,认为各台机器生产的薄板厚度有明显的差异。各项数据如下两个图所示:
作者:YangYF