R语言案例分析:多元数据的基本统计分析

时间:2022-03-13 13:01:06

R语言案例分析:多元数据的基本统计分析

来自《多元统计分析与R语言建模》 第四版 

数据集下载

我们利用该数据集中的Case1来完成下面的R语言操作:

R语言案例分析:多元数据的基本统计分析

options(digits = 4) #输出结果位数
par(mar=c(4, 4, 2, 1) + 0.1, cex=0.8) # 图形修饰
case1 <- read.csv("clipboard", header=T, sep = "\t") #复制表中的数据,直接创建case1
head(case1)
     地区 性别 教育程度    观点     年龄 月收入 月支出
1    A      女       中            不支持   55   2299   1423
2    A      女       低   不支持   39   3378   2022
3    A      女       中   支持       33   3460   1868
4    B      男       高   支持       41   4564   1918
5    B      女       高  不支持    55   3206   1906
6    A      女       中  不支持    48   4043   2233

summary(case1)
地区    性别     教育程度     观点                           年龄              月收入               月支出     

A:204   男:603   低:319   不支持:628       Min.   : 6.0          Min.   : 637         Min.   : 797   

B:401   女:597   高:303   支持  :568   1st Qu.:34.0      1st Qu.:2388      1st Qu.:1722   

C:384                 中:578    NA's  : 4        Median :40.0    Median :2978   Median :1993   

D:211                         Mean   :40.1      Mean   :3006     Mean   :1997                                

3rd Qu.:47.0      3rd Qu.:3624     3rd Qu.:2262                               

 Max.   :72.0        Max.   :6239      Max.   :3385

# 定性分析
attach(case1) #绑定数据
T1 <- table(地区)

T1

   A    B    C    D 
204 401 384 211
barplot(T1) #绘制条形图
R语言案例分析:多元数据的基本统计分析

# 定量分析
f <- hist(月收入) #直方图
R语言案例分析:多元数据的基本统计分析

# 定性定量分析
boxplot(月收入~性别) #箱线图
R语言案例分析:多元数据的基本统计分析

t.test(月收入~性别) #t检验
Welch Two Sample t-test
data:  月收入 by 性别
t = 0.51, df = 1200, p-value = 0.6
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -75.43 128.49
sample estimates:
mean in group 男 mean in group 女 
                        3019                      2993

# 接受男女的月收入无显著差异的假设(p>0.5)

# 二维列联表分析
T2 <- table(性别, 观点)
T2
        观点
性别 不支持 支持
  男    319    282
  女    309    286

barplot(T2, beside = TRUE) # 条形图
R语言案例分析:多元数据的基本统计分析

barplot(T2, beside = F) # 条形图
R语言案例分析:多元数据的基本统计分析

# beside=T表示绘制分组条形图,beside=F表示绘制堆叠条形图

# 多维列联表分析
T3 <- ftable(性别, 教育程度, 观点) # 创建一个紧凑的"平铺"式列联表
T3
                      观点     不支持 支持
性别    教育程度                 
男              低                81     88
      高                78     66
      中                160  128
女     低                82     68
      高                86     72
      中                141  146


barplot(T3, beside = TRUE, col = 3:4) #条形图
R语言案例分析:多元数据的基本统计分析

T4 <- ftable(教育程度, 性别, 观点)
T4
                           观点 不支持  支持
教育程度      性别                 
低       男           81     88
         女           82     68
高       男           78     66
         女           86     72
中       男           160  128
         女           141  146

barplot(T4, beside = TRUE, col = 3:4) #条形图
R语言案例分析:多元数据的基本统计分析

detach(case1) #解除绑定