第三章 概率与分布的r语言代码

时间:2021-10-26 06:12:41
3.1随机抽样
1)等可能的不放回的随机抽样的样本
sample(x, n)#x为要抽取的向量,n为样本容量
sample(1:52, 4)  #从52张扑克牌中抽取4张
[1] 3 16 17 15


2)等可能的有放回的随机抽样的样本
sample(x, n, replace=TRUE) #选项replace=TRUE表示抽样是有放回的
sample(c("H", "T"), 10, replace=T)  #例如抛一枚均匀的硬币10次
[1] "H" "T" "T" "H" "H" "T" "T" "H" "H" "H"
sample(1:6, 10, replace=T) #掷一棵骰子10次
[1] 4 3 4 5 4 6 2 6 3 4


3)不等可能的随机抽样的样本:
sample(x, n, replace=TRUE, prob=y)#选项prob=y用于指定x中元素出现的概率,向量y与x等长度.
sample(c("成功","失败"),10, replace=T, prob=c(0.9,0.1)) #一名外科医生做手术成功的概率为0.90,那么他做10次手术
sample(c(1,0), 10, replace=T, prob=c(0.9,0.1)) #若以1表示成功,0表示失败
[1] 1 1 1 0 1 1 1 1 1 1


3.2排列组合与概率的计算
例3.2.1从一副完全打乱的52张扑克中取4张,求以下事件的概率:
1)抽取的4张依次为红心A,方块A,黑桃A和梅花A的概率;
2)抽取的4张为红心A,方块A,黑桃A和梅花A的概率.
1/prod(52:49) #抽取的4张是有次序的,因此使用排列来求解.所求的事件(记为A)概率为
[1] 1.539077e-07


1/choose(52,4) #抽取的4张是没有次序的,因此使用组合数来求解
[1] 3.693785e-06




3.3概率分布
对于所给的分布名称,加前缀“d”(代表密度函数,density)就得到R的密度 函数(对于离散分布,指分布律);
加前缀“p”(代表分布函数或概率,CDF)就 得到R的分布函数;
加前缀“q”(代表分位函数,quantile)就得到R的分位数 函数;
加前缀“r”(代表随机模拟,random)就得到R的随机数发生函数.


若R中分布的函数名为func,则四类函数的调用格式为:
1)概率密度函数:dfunc(x, p1, p2, ...), x为数值向量;
2)(累积)分布函数:pfunc(q, p1, p2, ...), q为数值向量;
3)分位数函数:qfunc(p, p1, p2, ...), p为由概率构成的向量;
4)随机数函数:rfunc(n, p1, p2, ...), n为生成数据的个数
其中p1, p2,...是分布的参数值.上面的表格中有具体数值的是这些参数在空 缺时对应的缺省值.


最后通过二个例子简单说明一下它们的作用:
1)查找分布的分位数,用于计算假设检验中分布的临界值或置信区间的置 信限.例如
qnorm(0.025)  #显著性水平为5%的正态分布的双侧临界值是:
[1] -1.959964
qnorm(0.975)
[1] 1.959964
2)计算假设检验的p值.
1 - pchisq(3.84, 1) #比如*度df=1的卡方=3.84时的卡方检验的p值为
[1] 0.05004352


>2*pt(-2.43, df = 13) #而容量为14的双边t检验的p值为
[1] 0.0303309