因为不能期望点估计量能给出总体参数的精确值,故常在点估计量上加减一个边际误差来计算区间估计。
8.1 当总体标准差已知时,总体均值的区间估计
区间估计
1-α表示置信系数。
比如置信系数为0.95时,则这个区间称为95%的置信区间,有95%的把握相信区间内包含总体均值μ。或者换种说法,从区间中随机取100个数,再次组成区间,约有95个区间包含总体均值。
如果总体的分布不服从正态分布,那样本容量要尽量大。
8.2 总体均值的区间估计:σ未知的情况
更常见的情况是σ未知,用样本标准差估计总体标准差,边际误差和总体均值的区间估计都已t分布的概率分布为依据。
t分布是一类相似的概率分布组成的分布族,某个特定的t分布依赖于*度。
随着*度的增大,t分布和标准正态分布越来越像。
区间估计
8.3 样本容量的确定
E表示希望达到的边际误差
样本容量
8.4 总体比率
区间估计
假设检验
9.1 原假设和备择假设的建立
将研究中的假设作为备择假设,将受到挑战的假说设为原假设。
9.2 第一类错误和第二类错误
第一类错误是拒真,第二类错误是纳伪。
当原假设为真且以等式出现时犯第一类错误的概率称为检验的显著性水平,用α表示,通常取0.05或0.01。
9.3 总体均值的检验,当总体标准差已知
假设检验的步骤:先提出原假设和备择假设,指定检验中的显著性水平,收集样本数据并计算检验统计量。
此处进行的是总体均值的检验,且假定总体标准差已知,故检验统计量的计算方法为
p-值法:利用检验统计量的值计算出p值,与显著性水平进行比较,如果p-值≤α,则拒绝原假设。
临界值方法:通过显著性水平计算出临界值和拒绝法则,用检验统计量确定是否拒绝原假设。
区间估计和假设检验的关系,可以通过区间估计来进行假设检验,设置信水平为0.95,显著性水平为0.05,如果原假设中的总体均值在置信区间中,则不能拒绝原假设。
9.4 总体标准差未知时检验总体均值
检验统计量
检验统计量服从*度为n-1的t分布。
检验步骤和上面一样。
9.5 总体比率
检验统计量服从标准正态概率分布。
9.6 假设检验与决策
前面都是控制了第一类错误,所以得出的结论是不能拒绝原假设而不是接受原假设,因为没有控制第二类错误。
9.7 计算第二类错误的概率
9.8 对总体均值进行假设检验时样本容量的确定
两总体均值和比例的推断
10.1 两总体均值之差的推断,两个总体方差已知时
样本均值之差的标准误差
两总体均值之差的区间估计
两总体均值之差的假设检验
假设两总体均值之差为D0,对其进行假设检验。
计算检验统计量
计算出p值,如果小于显著性水平,则拒绝均值之差为D0的原假设。
10.2 两总体均值之差的推断,总体方差均未知时
总体均值之差的区间估计
服从t分布,*度需要计算,计算结果向下取整。
得到*度后选择对应的t分布表,即可求出区间估计。
均值之差的假设检验
检验统计量的计算
根据检验统计量求出p值并与显著性水平比较。
10.3 两总体均值之差的推断:匹配样本
搜集生产时间数据时有两种方案,一种基于独立样本,一种基于匹配样本。
独立样本设计:抽取两个随机样本,第一个样本中的工人用方法一进行生产,第二个样本中的工人用方法二进行生产。
匹配样本设计:抽取一个随机样本,样本中的工人分别用方法一、二进行生产。
匹配样本设计消除了工人间的差异,误差会比较小。
检验统计量的计算
进一步算出p值,和α进行比较。
10.4 两总体比例之差的推断
总体方差的统计推断
11.1 一个总体方差的统计推断
样本方差
总体方差的区间估计
卡方值为基于*度为n-1的卡方分布。
假设检验
检验统计量
后面用p值法或者临界值法进行判断。
11.2 两个总体方差的统计推断
当两个正态总体的方差相等时,样本方差之比的抽样分布服从F分布
分子*度为n1-1,分母*度为n2-1。
s1是取自总体1的样本量为n1的样本标准差。
检验两个总体方差是否相等,所作假设如下
检验统计量
样本方差较大的放上面。
多个比例的比较,独立性及拟合优度检验
12.1 三个或多个总体比例的相等性的检验
原假设是多个总体的比例全部相等,备择假设是不全相等。
举个例子,调查三种车的顾客品牌忠诚度
如果三种车的顾客品牌忠诚度相等,计算出期望频数
根据观测值和期望值计算出检验统计量,检验统计量服从*度为k-1的卡方分布,k表示总体个数。
从例子中得到拒绝原假设的结论,下一个问题是确定那几个比例间存在差异,通过多重比较方法判断——Marascuilo方法。
12.2 独立性检验
卡方检验的一个重要应用是利用样本数据检验两个分类变量的独立性。
检验的原假设是两个分类变量独立。
举个例子,抽取200名饮酒者,调查啤酒类型和性别是否存在关系。
求出观察频数
根据两个频数表计算出卡方值
设分类变量1有n个,分类变量2有m个,那么*度为(n-1)(m-1)个。
12.3 拟合优度检验
通过卡方检验来确定被抽样的总体是否服从某个特殊的概率分布。
检验总体是否服从多项概率分布。
举个例子,市场上产品A、B、C的占有率为30%,50%,20%,C产品后来搞了个改进,对总体抽取样本,进行假设检验,看这个改进是否对占有率产生了影响。
原假设是总体仍然服从原来的概率分布,即改进没有影响。
根据样本得到观察频数表
根据原概率分布得到期望频数表
计算检验统计量
*度为3-1=2。
检验某总体是否服从正态分布。
举个例子,求下面的测试分数是否服从正态分布
将样本数除5,即可得到应该建立的区间个数。除5表示每个区间的期望频数应该是5。
这里样本数为50,可以建立10个区间
将观测数据分配到区间
根据观测频数和期望频数计算出检验统计量
此处*度为10-2-1=7,2表示两个样本估计的参数:均值和标准差。
实验设计与方差分析
因子可以理解为分类变量,因子中的处理理解为分类变量有多少个。
应用方差分析需要三个假定:一是对每个总体,响应变量服从正态分布,二是响应变量的方差对所有总体是相同的,三是观测值必须是独立的。
利用方差分析可以确定,在三个样本均值之间观察到的差异是否足够大到可以拒绝三个样本均值相等的原假设。
如果三个总体均值相等,我们就可以期望三个样本均值很接近。
如果方差分析的假设成立并且原假设为真,则每一个样本都是来自均值为μ,方差为σ^2的正态分布。
来自正态总体的容量为n的一个简单随机样本,其样本均值的抽样分布仍然服从正态分布,均值为μ,方差为σ^2/n。
举个例子,公司有三种生产方法,假设三个方法的总体均值相等,那么三个样本来自同一个正态分布,通过三个样本均值的均值与方差可以用来估计该抽样分布的均值与方差。
此处样本均值抽样分布的均值的一个估计值是三个样本均值相加除3,等于60,通过抽样分布的均值再算出抽样分布的方差。
由于抽样分布的方差等于总体方差除样本数,可以求出总体方差,这个总体方差被称为方差的处理间估计。
总体方差还有一个估计值,叫处理内估计,即将三个样本的方差相加除3,等于28.33。
无论原假设是真是假,处理内估计都是总体方差的一个好的估计量,若原假设为假,则处理间估计会高估总体方差。
13.2 方差分析和完全随机化实验设计
应用方差分析检验k个总体均值是否相等,原假设一般为k个总体均值全相等,备择假设是不全相等。
总样本均值等于分样本均值的均值,分样本的样本容量相等。
总体方差的处理间估计:称总体方差的这个估计量为均方处理
k表示样本个数,nj表示样本容量,xj表示样本均值,x拔拔表示总样本均值。
如果原假设为真,那么MSTR给出了总体方差的一个无偏估计,否则会高估总体方差。
总体方差的处理内估计:称总体方差的这个估计量为均方误差
k表示样本个数,nT表示总样本容量,nj表示样本容量,sj^2表示样本方差。
MSE永远给出总体方差的无偏估计。
方差估计量的比较:F检验
对于正态总体,总体方差的两个独立的估计量之比的抽样分布服从F分布。如果原假设为真且方差分析的假定得到满足,则MSTR/MSE的抽样分布服从分子*度为k-1,分母*度为nT-k的F分布。
ANOVA表
13.3 多重比较方法
当原假设被拒绝时,需要判断哪几个总体均值之间存在差异。
Fisher的LSD方法
13.4 随机化区组设计
这种方法通过消除MSE项中来自外部的变异,以达到控制变异外部来源的目的。
举个例子
参加测试的管理员对每个系统进行测试,消除了个体间的差异。
ANOVA方法
13.5 析因试验
为了得到两个或以上因子同时存在时的一些统计结论。
例子,研究辅导课程和本科院校这两个因子对考试分数的影响。
每个处理组合的样本容量为2。
ANOVA方法