R统计软件画图

时间:2024-04-13 18:59:54

3.1某单位对100名女生测定血清蛋白含量(g/L),数据见附表:

计算均值、方差、方差标准差、极差、标准误、变异系数、偏度、峰度。

 

>library("moments")

>myData<-read.csv("exercise3.1.csv",head=F)

>myData<-unlist(as.list(myData))

>data.mean<-mean(myData)  #均值

> data.mean

[1] 73.668

> data.var<-var(myData)   #方差

> data.var

[1] 15.51513

> data.sd<-sd(myData)  #标准差

> data.sd

[1] 3.938925

> #标准误 = 标准误差/根号100

>data.serror<-data.sd/sqrt(100) #标准误

> data.serror

[1] 0.3938925

> data.jc<-max(myData)-min(myData)  #极差

> data.jc

[1] 20

>data.byxs<-data.var/data.mean   #变异系数

> data.byxs

[1] 0.2106088

> data.bia<-skewness(myData)    #偏度

> data.bia

[1] 0.05324501

> data.pea<-kurtosis(myData)  #峰度

> data.pea

[1] 2.975791

3.2绘出习题3.1的直方图、密度估计曲线、经验分布图和QQ图,并将密度估计曲线与正态密度曲线相比较,将经验分布曲线与正态分布曲线相比较(其中正态分布曲线的均值和标准差取习题3.1计算出的值)。

 

> hist(myData,freq=F) #直方图

>lines(density(myData),col=”red”)   #密度估计曲线

>X<-64:86

>lines(X,dorm(X,data.mean,data.sd),col=”blue”) #正态密度曲线

 

 

 

 


 

>#经验分布图

> plot.ecdf(myData,verticals=TRUE,do.p=FALSE,main="Empiricaldistribution map")

>X<-64:85

> lines(X,pnorm(X,data.mean,data.sd),col="purple") #正态分布曲线

 


 

 

 

 

 

 

 

>qqnorm(myData)   #QQ图

>qqline(myData,col = "red")


 

3.3绘出习题3.1的茎叶图、箱线图、并计算五数总括。

 

> stem(myData)    #茎叶图

 Thedecimal point is at the |

 

  64| 300

  66| 23333

  68| 00888777

  70| 344444442222

  72| 0000000777777555555555555

  74| 33333333700000004688888

  76| 5555555226

  78| 0888555

  80| 355266

  82|

  84| 3

 

> fivenum(myData) #五数总括

 V44  V65 V69  V53 V710

64.3 71.2 73.5 75.8 84.3

 

>boxplot(myData,col=”lightblue”,notch=T,main="Boxplot ofData")      #箱线图

 


 

3.7某校测得19名学生的四项指标,性别、年龄、身高(cm)和体重(磅),具体数据由表3.9所示,(1)试绘出体重对于身高的散点图;(2)绘出不同性别情况下,体重与身高的散点图;(3)绘出不同年龄段的体重与身高的散点图;(4)分不同性别和不同年龄段的体重与身高的散点图。数据见附表。

 

> myData2<-read.csv("exercise3.7.csv")

> attach(myData2)

The following objects are masked from myData2 (pos = 3):

 

    年龄, 身高, 体重, 性别, 姓名, 学号

 

> plot(身高,体重,xlab = "height",ylab="weight",main="heightand weight")

 

 


 

> coplot(身高~体重|性别)  #不同性别,身高和体重的散点图

 

 

> coplot(身高~体重|年龄)   #不同年龄身高和体重的散点图

> coplot(身高~体重|性别*年龄)

> #在不同性别和不同年龄下的身高和体重的散点图

 

 

 

 

 

 

姓名:冯苗

性别:女

学号:20153821

专业:统计学

 

 

二〇一八年五月十一日星期五

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


                                                                                                              

 


 

 

 

 

 

3.1某单位对100名女生测定血清蛋白含量(g/L),数据见附表:

计算均值、方差、方差标准差、极差、标准误、变异系数、偏度、峰度。

 

>library("moments")

>myData<-read.csv("exercise3.1.csv",head=F)

>myData<-unlist(as.list(myData))

>data.mean<-mean(myData)  #均值

> data.mean

[1] 73.668

> data.var<-var(myData)   #方差

> data.var

[1] 15.51513

> data.sd<-sd(myData)  #标准差

> data.sd

[1] 3.938925

> #标准误 = 标准误差/根号100

>data.serror<-data.sd/sqrt(100) #标准误

> data.serror

[1] 0.3938925

> data.jc<-max(myData)-min(myData)  #极差

> data.jc

[1] 20

>data.byxs<-data.var/data.mean   #变异系数

> data.byxs

[1] 0.2106088

> data.bia<-skewness(myData)    #偏度

> data.bia

[1] 0.05324501

> data.pea<-kurtosis(myData)  #峰度

> data.pea

[1] 2.975791

3.2绘出习题3.1的直方图、密度估计曲线、经验分布图和QQ图,并将密度估计曲线与正态密度曲线相比较,将经验分布曲线与正态分布曲线相比较(其中正态分布曲线的均值和标准差取习题3.1计算出的值)。

 

> hist(myData,freq=F) #直方图

>lines(density(myData),col=”red”)   #密度估计曲线

>X<-64:86

>lines(X,dorm(X,data.mean,data.sd),col=”blue”) #正态密度曲线

 

 

 

 


 

>#经验分布图

> plot.ecdf(myData,verticals=TRUE,do.p=FALSE,main="Empiricaldistribution map")

>X<-64:85

> lines(X,pnorm(X,data.mean,data.sd),col="purple") #正态分布曲线

 


 

 

 

 

 

 

 

>qqnorm(myData)   #QQ图

>qqline(myData,col = "red")


 

3.3绘出习题3.1的茎叶图、箱线图、并计算五数总括。

 

> stem(myData)    #茎叶图

 Thedecimal point is at the |

 

  64| 300

  66| 23333

  68| 00888777

  70| 344444442222

  72| 0000000777777555555555555

  74| 33333333700000004688888

  76| 5555555226

  78| 0888555

  80| 355266

  82|

  84| 3

 

> fivenum(myData) #五数总括

 V44  V65 V69  V53 V710

64.3 71.2 73.5 75.8 84.3

 

>boxplot(myData,col=”lightblue”,notch=T,main="Boxplot ofData")      #箱线图

 


 

3.7某校测得19名学生的四项指标,性别、年龄、身高(cm)和体重(磅),具体数据由表3.9所示,(1)试绘出体重对于身高的散点图;(2)绘出不同性别情况下,体重与身高的散点图;(3)绘出不同年龄段的体重与身高的散点图;(4)分不同性别和不同年龄段的体重与身高的散点图。数据见附表。

 

> myData2<-read.csv("exercise3.7.csv")

> attach(myData2)

The following objects are masked from myData2 (pos = 3):

 

    年龄, 身高, 体重, 性别, 姓名, 学号

 

> plot(身高,体重,xlab = "height",ylab="weight",main="heightand weight")

 

 


 

> coplot(身高~体重|性别)  #不同性别,身高和体重的散点图

 

 

> coplot(身高~体重|年龄)   #不同年龄身高和体重的散点图

> coplot(身高~体重|性别*年龄)

> #在不同性别和不同年龄下的身高和体重的散点图

 

 

 

 

 

 

 


 

 

附表:

 

74.3

78.8

68.8

78

70.4

80.5

80.5

69.7

71.2

73.5

79.5

75.6

75

78.8

72

72

72

74.3

71.2

72

75

73.5

78.8

74.3

75.8

65

74.3

71.2

69.7

68

73.5

75

72

64.3

75.8

80.3

69.7

74.3

73.5

73.5

75.8

75.8

68.8

76.5

70.4

71.2

81.2

75

70.4

68

70.4

72

76.5

74.3

76.5

77.6

67.3

72

75

74.3

73.5

79.5

73.5

74.7

65

76.5

81.6

75.4

72.7

72.7

67.2

76.5

72.7

70.4

77.2

68.8

67.3

67.3

67.3

72.7

75.8

73.5

75

73.5

73.5

73.5

72.7

81.6

70.3

74.3

73.5

79.5

70.4

76.5

72.7

77.2

84.3

75

76.5

70.4

3.1数据

 

3.7数据

表3.9:学生身高体重的数据

 

学号

姓名

性别

年龄

身高

体重

1

Alice

F

13

56.5

84

2

Becka

F

13

65.3

98

3

Gail

F

14

64.3

90

4

Karen

F

12

56.3

77

5

Kathy

F

12

59.8

84.5

6

Mary

F

15

66.5

112

7

Sandy

F

11

51.3

50.5

8

Sharon

F

15

62.5

112.5

9

Tammy

F

14

62.8

102.5

10

Alfred

M

14

69

112.5

11

Duke

M

14

63.5

102.5

12

Guido

M

15

67

133

13

James

M

12

57.3

83

14

Je?rey

M

13

62.5

84

15

John

M

12

59

99.5

16

Philip

M

16

72

150

17

Robert

M

12

64.8

128

18

Thomas

M

11

57.5

85

19

William

M

15

66.5

112

 

 R统计软件画图