-
假设检验的一般步骤
某工厂生产的一种螺钉,标准要求长度是32.5毫米。实际生产的产品,其长度X假定服从正态分布未知,现从该厂生产的一批产品中抽取6件,得尺寸数据如下:
32.56, 29.66, 31.64, 30.00, 31.87, 31.87, 31.03
问这批产品是否合格?()
分析:这批产品(螺钉长度)的全体组成问题的总体X。现在要检验是否为32.5毫米。
第一步:提出原假设和备选假设
第二步:取一检验统计量,在成立下求出它的分布。
能衡量差异大小且分布已知。第三步:对给定的显著性水平,查表确定临界值。
即是一个小概率事件。而小概率事件在一次试验中基本上不会发生。
得否定域
第四步:将样本值代入算出统计量t的实测值。
第五步:给出结论。
没有落入拒绝域,故不能拒绝注意:这并不意味着一定对,只是差异还不够显著,不足以否定
-
思考:假设检验会不会犯错误呢?
由于作出结论的依据是”小概率原理“,即小概率事件在一次试验中基本上不会发生。但不是一定不发生。
-
假设检验的两类错误:
第一类:如果成立,但统计量的实测值落入否定域,从而作出否定的结论,那就犯了”以真为假“的错误。
第二类:如果不成立,但统计量的实测值未落入否定域,从而没有作出否定的结论,即接受了错误的,那就犯了”以假为真“的错误。
犯两类错误的概率:
两类错误是互相关联的,当样本容量固定时,一类错误概率的减少导致另一类错误概率的增加。
要同时降低两类错误的概率,或者要在不变的条件下降低,需要增加样本容量。
-
假设检验和区间估计
关系:参数的区间估计和假设检验从不同的角度回答同一问题,它们的统计推断方法是相通的。参数的区间估计可通过利用假设检验的方法来解决,同样,参数的假设检验问题可通过利用区间估计的方法来解决。
区别:
- 参数估计解决的是多少(或范围)的问题;假设检验则判断结论是否成立。前者解决的是定量问题,后者解决的是定性问题。
- 两者的要求不同。区间估计确定在一定概率保证程度下给出未知参数的范围。而假设检验确定在一定的置信水平下,未知参数能否接受已给定的值。
- 两者对问题的了解程度各不相同。进行区间估计之前不了解未知参数的有关信息。而假设检验对未知参数的信息有所了解,但作出某种判断无确切把握。
-
单侧检验
e.g.
(1)某织物强力指标X的均值公斤,改进工艺后生成一批织物,今从中取30件,测得公斤。假设强力指标服从正态分布,且公斤,问在显著性水平下,新生产织物比过去的织物强力是否有提高?
解:提出假设:
取统计量
否定域为
代入样本值,计算得统计量U的实测值
落入否定域中,故拒绝原假设此时可能犯第一类错误,因为实际的可能为真,但是犯错误的概率不超过。
(2)为比较两台自动机床的精度,分别取容量为10和8的两个样本,测量某个指标的尺寸(假定服从正态分布),得到下列结果:
车床甲: 1.08 1.10 1.12 1.14 1.15 1.25 1.36 1.38 1.40 1.42 车床乙: 1.11 1.12 1.18 1.22 1.33 1.35 1.36 1.38 在时,问这两台机床是否有同样的精度?
解:设两台自动机床的方差分别为,
在下检验假设:
取统计量
其中,为两样本的样本方差.否定域为
由样本值可计算得F的实测值为:
查表得
由于 0.304<1.51<3.68, 故接受,这时可能犯第二类错误,因为实际的可能为假。 -
注意:到现在为止,我们讨论的都是正态总体均值和方差的假设检验,或样本容量较大,可用正态近似的情形。
-
总结:
一般来说,按照检验所用的统计量的分布,分为
U检验 — 用正态分布
t检验 — 用t分布
检验 — 用分布
F检验 — 用F分布
在大样本的条件下,若能求得检验统计量的极限分布,依据它去决定临界值C。
按照对立假设的提法,分为
双侧检验,它的拒绝域取在两侧;
单侧检验,它的拒绝域取在左侧或右侧。