一、假设检验的两类错误:
第Ⅰ类错误:实际情况与 一致时,却根据统计量数值拒绝
,这样的错误称为第Ⅰ类错误;出现第Ⅰ类错误的概率用
表示。
第Ⅱ类错误:实际情况与不一致时,却根据统计量数值不拒绝
,这样的错误称为第Ⅱ类错误;出现第Ⅱ类错误的概率用
表示。
二、假设检验的两类错误为什么不能同时变小?
假如理论告诉我们参数只可能在0和1之间取值,检验统计量服从
分布。检验统计量可取值于整个
,我们想要划分
为
,
,使得落在
时接受
:
的假设,而落在
时接受
:
的假设。
现在问题是如何划分,
。事实上不同的原则可以导出不同的划分方法,其中每一个都是不同的检验。其中每种检验都对应相应的的第一类第二类错误概率值,所谓第一类第二类错误值不能同时减小,指的就是在这一阶段不可能通过单纯改变
,
的划分方式来同时降低两类错误概率。
至于为什么这一阶段不可能通过改变,
划分来降低两类错误概率,由下图所示:
若以1/2为分隔点,当检验统计量落在其左边接受:
落在右边时接受
:
。
当的确为0时,即
:
假设正确时,错误概率为落在1/2右边的概率(第一类错误发生的概率
)。如下图所示:
当的确为1时,错误概率(第二类错误发生的概率
)为落在1/2左边,如下图所示:
将分割线移到0时,:
错误率升为
此时,:
时错误率降为
由以上分析可获结论:对于某一具体的检验来说,当样本量一定时,
越小
越大,
越大
越小。
三、检验的功效
实际上不成立时,根据统计量的数值拒绝
, 做对了!这样的概率,称为检验功效(power of test),记为
。
检验功效的意义:当两个总体参数的确存在差异时,所使用的统计检验能够发现这种差异的概率。
例 如果 = 0.90,则意味着当
实际上不成立时,理论上在每100次检验中,平均有90次能拒绝
。
单样本设计资料t 检验的功效
例 已知北方地区一般儿童前囟门闭合月龄的均值为14.1,某研究人员从东北某缺钙地区抽取36名儿童,得前囟门闭合月龄均值为14.3,标准差为5.08。问该县儿童前囟门闭合月龄是否大于一般儿童的前囟门闭合月龄?
分析:根据医学专业知识,缺钙地区不会闭合得更快,但有可能闭合得慢些,故可作单侧检验。
结论:经假设,得
=0.236,
>0.05,不拒绝
。
但是以上的结论也可能样本量小, 检验的功效不够大导致的,所以我们要计算该检验的功效
功效计算公式
: 样本量
: 欲发现的最小差异(或容许误差)
: 总体标准差;
: 标准正态分布的临界值。单侧检验时取单侧临界值; 双侧检验时取双侧临界值
: 标准正态分布的单侧临界值(永远是一个单侧的临界值,即标准正态分布上侧尾部面积为
所对应的那个临界值)。
算得后,反查标准正态分布表来确定
,进而得到
。
根据现有知识,= 0.5月,
= 5月,
=1.645 (单侧)
由标准正态分布表查得= 0.8531,
= 0.1469 欲发现
= 0.5 月的差别,概率只有 14.69%,检验功太小!
三、影响检验功效的主要因素
1、参数间(两均数和
)差异越大,功效越大
2、个体差异越小,功效越小
3、样本量越大,功效越大(样本量小曲线较胖,样本量大曲线较瘦)
4、越大,功效越大
在假设检验结果的解释和评价中,特别是分析那些未能拒绝 的假设检验结果,事后估计
的值,有助于判断是总体的参数确实没有差别,还是由于样本量太小,而导致检验效能不足,如
< 80%。