R之基本统计分析

时间:2020-12-15 16:50:24

此博客主要评述用于生成基本的描述性统计量和推断统计量的R函数。

  • 描述性统计分析:关注对连续型变量的中心趋势、变化性和分布形状的分析。
    1.用summary()函数来获取描述性统计变量
    将得到最小值,最大值,四分位数和数值型变量的均值,以及因子向量和逻辑型向量的频数统计,结合apply()和sapply()函数计算所选择的任一描述性统计量。
    扩展:
    Hmisc包中的describe()函数可返回变量和观测的数量、缺失值和唯一值的数目、平均值、分位数以及五个最大的值和五个最小的值
library("Hmisc")
vars <- c("mpg","hp","wt")
describe(mtcars[vars])
a <- describe(mtcars[vars])
#通过a$来获取结果
a$counts[1] 即为观测数量的值

pastecs包中有一个名为stat.desc()函数,它可以计算种类繁多的描述性统计量,其格式为:

stat.desc(x,basic=TRUE,desc=TRUE,norm=FALSE,p=0.95)

其中x是一个数据框或时间序列,若basic=TRUE(默认值),则计算其中所有值、空值、缺失值的数量,以及最小值、最大值、值域、还有总和,还有总和。若desc=TRUE(同样也是默认值),则计算中位数、平均数、平均数的标准误、平均数置信度为95%的置信区间、方差、标准差以及变异系数。最后,若norm=TRUE(不是默认的),则返回正态分布统计量,包括偏度和峰度(以及它们的统计显著程度)和Shapiro-Wilk正态检验结果。这里使用了p值来计算平均数的置信区间(默认置信度为0.95)

psych包