一、假设检验的两类错误:
第Ⅰ类错误:实际情况与 一致时,却根据统计量数值拒绝,这样的错误称为第Ⅰ类错误;出现第Ⅰ类错误的概率用表示。
第Ⅱ类错误:实际情况与不一致时,却根据统计量数值不拒绝,这样的错误称为第Ⅱ类错误;出现第Ⅱ类错误的概率用表示。
二、假设检验的两类错误为什么不能同时变小?
假如理论告诉我们参数只可能在0和1之间取值,检验统计量服从分布。检验统计量可取值于整个,我们想要划分为,,使得落在时接受:的假设,而落在时接受:的假设。
现在问题是如何划分,。事实上不同的原则可以导出不同的划分方法,其中每一个都是不同的检验。其中每种检验都对应相应的的第一类第二类错误概率值,所谓第一类第二类错误值不能同时减小,指的就是在这一阶段不可能通过单纯改变,的划分方式来同时降低两类错误概率。
至于为什么这一阶段不可能通过改变,划分来降低两类错误概率,由下图所示:
若以1/2为分隔点,当检验统计量落在其左边接受:落在右边时接受:。
当的确为0时,即:假设正确时,错误概率为落在1/2右边的概率(第一类错误发生的概率)。如下图所示:
当的确为1时,错误概率(第二类错误发生的概率)为落在1/2左边,如下图所示:
将分割线移到0时,:错误率升为
此时,:时错误率降为
由以上分析可获结论:对于某一具体的检验来说,当样本量一定时, 越小 越大,越大 越小。
三、检验的功效
实际上不成立时,根据统计量的数值拒绝, 做对了!这样的概率,称为检验功效(power of test),记为。
检验功效的意义:当两个总体参数的确存在差异时,所使用的统计检验能够发现这种差异的概率。
例 如果 = 0.90,则意味着当 实际上不成立时,理论上在每100次检验中,平均有90次能拒绝。
单样本设计资料t 检验的功效
例 已知北方地区一般儿童前囟门闭合月龄的均值为14.1,某研究人员从东北某缺钙地区抽取36名儿童,得前囟门闭合月龄均值为14.3,标准差为5.08。问该县儿童前囟门闭合月龄是否大于一般儿童的前囟门闭合月龄?
分析:根据医学专业知识,缺钙地区不会闭合得更快,但有可能闭合得慢些,故可作单侧检验。
结论:经假设,得=0.236,>0.05,不拒绝。
但是以上的结论也可能样本量小, 检验的功效不够大导致的,所以我们要计算该检验的功效
功效计算公式
: 样本量
: 欲发现的最小差异(或容许误差)
: 总体标准差;
: 标准正态分布的临界值。单侧检验时取单侧临界值; 双侧检验时取双侧临界值
: 标准正态分布的单侧临界值(永远是一个单侧的临界值,即标准正态分布上侧尾部面积为所对应的那个临界值)。
算得后,反查标准正态分布表来确定,进而得到。
根据现有知识,= 0.5月, = 5月, =1.645 (单侧)
由标准正态分布表查得= 0.8531,= 0.1469 欲发现= 0.5 月的差别,概率只有 14.69%,检验功太小!
三、影响检验功效的主要因素
1、参数间(两均数和)差异越大,功效越大
2、个体差异越小,功效越小
3、样本量越大,功效越大(样本量小曲线较胖,样本量大曲线较瘦)
4、越大,功效越大
在假设检验结果的解释和评价中,特别是分析那些未能拒绝 的假设检验结果,事后估计的值,有助于判断是总体的参数确实没有差别,还是由于样本量太小,而导致检验效能不足,如< 80%。