统计学-R语言-7.5-假设检验

时间:2024-01-27 11:50:45

单个总体均值的假设检验

一家公司声称它的员工月工资平均为3500元。下表是随机挑选的该公司的15名员工的月工资。该样本的均值为3056.667元,人们因此想检验厂家所声称的平均工资是否属实, α=0.05。
在这里插入图片描述
设:该厂家的员工平均工资为u,H0:公司员工平均工资为3500,H1:公司员工平均工资小于3500
H0:u在这里插入图片描述3500 H1:u<3500

salary=c(2000,2100,2200,2350,2500,2900,3500,3800,2600, 3300, 3200, 4000,4100,3100,4200) 
t.test(salary,m=3500,alt="less") 

One Sample t-test
data: salary
t = -2.2822, df = 14, p-value = 0.01931
alternative hypothesis: true mean is less than 3500
95 percent confidence interval:
-Inf 3398.81
sample estimates:
mean of x
3056.667

结论:p值等于0.01931 <0.05,于是在5%显著性水平下, 拒绝原假设,表明该厂家的平均工资小于3500元,与声称的3500不符。

单样本Wilcoxon符号秩检验

由于总体中位数为3100,而零假设的总体均值为3500,因此我们可以怀疑厂家所声称的3500元平均工资不属实。问题:采用Wilcoxon符号秩检验,检验该厂家的工资是否属实(α=0.05)检验中位数是大于等于3500元还是小于3500元
设:M代表厂家的员工工资中位数为3500,H0:该厂家员工中位数大于等于3500,H1:该厂家员工工资中位数小于3500
H0:M >=3500 H1:M <3500
首先对数据做茎叶图

stem(salary)

The decimal point is 3 digit(s) to the right of the | 2 | 0124
2 | 569
3 | 123
3 | 58
4 | 012
由茎叶图可以看出分布非常对称
可以应用Wilcoxon符号秩检验

salary=c(2000,2100,2200,2350,2500,2900,3500,3800,2600, 3300, 3200,4000,4100,3100,4200)
wilcox.test(salary ,m=3500,alt="less")

Wilcoxon signed rank test with continuity correction
data: salary
V = 22, p-value = 0.02977
alternative hypothesis: true location is less than 3500

得到W=22(软件输出的符号为V)检验的p值等于0.02977
因此,可以对大于p值的任意显著性水平拒绝零假设,认为厂家所声称的3500元平均工资不属实是有道理的

两个总体均值的假设检验

为了比较乘坐公交车上班快还是自己开车快,青原博士对两种方式所用时间各进行了10次记录,具体数据见下表。假设乘车时间服从正态分布。这些数据能提供充分证明说明开车上班的平均时间更快吗?(α=0.05)
在这里插入图片描述

x1=c(48,47,44,45,46,47,43,47,42,48)
x2=c(36,45,47,38,39,42,36,42,46,35)
time= c(x1,x2)
transportation=c(rep(1,10),rep(2,10))
traffic.time=cbind(time,transportation)
boxplot(time ~ transportation)

在这里插入图片描述

可以看出两个交通方式所需 时间确实存在着较大的差异。

在进行t检验之前,需要判断两个总体的方差是否相等
虽然在R中不需要假设方差相等也能进行两样本t检验,但我们仍 然可能对这个假设本身是否正确感兴趣
R中的var.test()函数的主要功能是对两样本的方差进行F检验。它
的使用方法和t.test()一样,对于本例:
var.test(time ~ transportation) $ p.value [1] 0.03792704

这个检验结果显著,所以拒绝方差相等这个假设
注意,这个检验有着两组数据独立的假设,所以不能在配对数据
上使用它
在这里插入图片描述

t.test (x1,x2,alt="greater")

在这里插入图片描述
结论:P=0.00297<0.05 拒绝原假设,表明开车上班比公交车上班更快

两个配对样本的Wilcoxon符号秩检验

一个有20人参加的技术革新试验前后的日产量列在下表中。这里,pre和post分别是试验前后的重量 (单位:个)。这里假定产量为正态分布。检验实验前与试验后的产量差异是否显著。(α=0.05)
在这里插入图片描述
设:μ1代表实验前的平均产量;μ2 代表试验后的平均产量 H0:μ1=μ2 H1:μ1在这里插入图片描述μ2
配对t检验通过下面的语句获得
注意,在函数调用时要明确地指明paired=T,表示希望进行一个
配对检验

t.test (pre, post, paired=T)

Paired t-test data: pre and post
t = -2.9843, df = 14, p-value = 0.009854
alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval:
-18.561978 -3.038022
sample estimates:
mean of the differences
-10.8
结论:p=0.009854,p<0.05,拒绝原假设,表明实验前后平均产量差异显著

如果对于产量的正态性有所怀疑,问:采用Wilcoxon符号秩检验分析:实验前与试验后的产量差异是否显著。(α=0.05)

设:M1代表实验前的产量的中位数;M2 代表试验后的均产量 的中位数 H0:M1=M2 H1:M1 在这里插入图片描述M2

wilcox.test (pre, post, paired=T)

Wilcoxon signed rank test with continuity correction data: pre and post
V = 17, p-value = 0.01576
alternative hypothesis: true location shift is not equal to 0
结果与t检验的没有很大差别
p值没有那么极端,这点也是意料之中
因为Wilcoxon秩和的最大值就是所有的差值符号都相等的时候,而t统计量则可以任意大 。拒绝原假设,表明实验前后平均产量差异显著