1.散点图
library(base)
attach(mtcars)
plot(mtcars$wt,mtcars$mpg,
main="Basic Scatter plot of MPG ",
xlab="Car Weight(lbs/100)",
ylab="Miles Per Gallon",
pch=19)
abline(lm(mtcars$mpg~mtcars$wt),col="red",lwd=2,lty=1)
lines(lowess(mtcars$wt,mtcars$mpg),col="blue",lwd=2,lty=2)
#lowess()函数用来添加一条平滑曲线,lowess()和loess(),loess是基于lowess()表达式版本的更新和更强大拟合函数
data:image/s3,"s3://crabby-images/4a356/4a3564374f9ea7c2298005049290c99353b22f15" alt=""
car中的scatterplot()函数可方便地绘制散点图,并添加拟合曲线、边界箱线图和置信椭圆,还可按子集绘图和交互式地识别点。
library(car)
scatterplot(mpg~wt|cyl,data=mtcars,lwd=2,
main="Scatter Plot of MPG by # Cylinders",
xlab="Weight of Car(lbs/1000)",
ylab="Miles Per Gallon",
=TRUE,
="identify",
labels=(mtcars),
boxplots="xy")
data:image/s3,"s3://crabby-images/54b75/54b75a51398ff6eb495f78b7129fae07f4c7342a" alt=""
2.散点图矩阵
(1)pairs()函数可创建基础的散点图矩阵
pairs(~mpg+disp+drat+wt,data=mtcars,main="Basic Scatter Plot Matrix")
data:image/s3,"s3://crabby-images/4f7f7/4f7f7cc6ca7460348fa4724fb1f3d7bb7ea8715e" alt=""
pairs(~mpg+disp+drat+wt,data=mtcars,main="Basic Scatter Plot Matrix",=NULL)
data:image/s3,"s3://crabby-images/6f1c0/6f1c03fbbf840b917ef49db6f8c977c89ca32907" alt=""
(2)car包中的scatterplotMatrix()函数也可生成散点图矩阵
scatterplotMatrix()函数创建的散点图矩阵,主对角线上有核密度曲线和轴须图,其余图形都含有线性和平滑拟合曲线
可进行如下操作:
以某个因子为条件绘制散点图矩阵;
包含线性和平滑拟合曲线;
在主对角线放置箱线图、密度图或者直方图;
在各单元格的边界添加轴须图。
library(car)
scatterplotMatrix(~mpg+disp+drat+wt,data=mtcars,spread=FALSE,=2,main="Scatter Plot Matrix via car Packages")
data:image/s3,"s3://crabby-images/e5ea8/e5ea838089dd64375fa87c482512134cbcd53dab" alt=""
library(car)
scatterplotMatrix(~mpg+disp+drat+wt|cyl,data=mtcars,spread=FALSE,diagonal="histogram",main="Scatter Plot Matrix via car Package")
data:image/s3,"s3://crabby-images/a4bed/a4bed8c1bd09b772159389957cf4579bfcccd624" alt=""
(3)gclus包中的cpairs()函数
提供一个有趣的散点图矩阵变种,含有可能重排矩阵中变量位置的选项,可让相关性更高的变量更靠近主对角线,还可对各单元格进行颜色编码来展示变量间的相关性大小。("gclus")
library(gclus)
mydata<-mtcars[c(1,3,5,6)]
<-abs
mycolors<-()
myorder<-()
cpairs(mydata,myorder,=mycolors,gap=5,main="Variable Ordered and Colored by Correlation")
data:image/s3,"s3://crabby-images/6e05b/6e05b68655e5d624c0a593f809d54263aabd621d" alt=""
由结果可知,相关性最高的变量是车重与排量,以及每加仑英里数与车重(标为红色,且离主对角线最近);
相关性最低的是后轴比与每加仑英里数(标注为黄色,且离主对角线很远)。
3.高密度散点图
(1234)
n<-10000
c1<-matrix(rnorm(n,mean=0,sd=.5),ncol=2)
c2<-matrix(rnorm(n,mean=3,sd=2),ncol=2)
mydata<-rbind(c1,c2)
mydata<-(mydata)
names(mydata)<-c("x","y")
with(mydata,plot(x,y,pch=19,main="Scatter Plot with 10,000 observation"))
data:image/s3,"s3://crabby-images/7aa2d/7aa2dc4f01ca2ceacd021ffe9b5457052254feb9" alt=""
with(mydata,smoothScatter(x,y,main="Scatterplot Colored by Smoothed Densities"))
hexbin包中的hexbin()函数将二元变量的封箱放到六边形单元格中
("hexbin")
library(hexbin)
with(mydata,{bin<-hexbin(x,y,xbins=50)
plot(bin,main="Hexagonal Binning with 10,000 Observations")})
data:image/s3,"s3://crabby-images/fd16d/fd16d25ddf1c7492b6b41165f0c57b9acb9c655e" alt=""
IDPmisc包中的iplot()函数可通过颜色来展示点的密度(在某特定点上数据点的数目)
with(mydata,iplot(x,y,main="Image Scatter Plot with Color Indicating Density"))
4.三维散点图
对三个变量的交互关系进行可视化 可用scatterplot3d中的scatterplot3d()函数来绘制它们的关系
("scatterplot3d")
library(scatterplot3d)
attach(mtcars)
scatterplot3d(mtcars$wt,mtcars$disp,mtcars$mpg,
main="Basic 3D Scatter Plot")
data:image/s3,"s3://crabby-images/ac086/ac0867ebb342d6372c40885dec73cc572ff93b7e" alt=""
library(scatterplot3d)
attach(mtcars)
scatterplot3d(mtcars$wt,mtcars$disp,mtcars$mpg,
pch=16,
highlight.3d=TRUE,
type="h",
main="Basic 3D Scatter Plot")
data:image/s3,"s3://crabby-images/9150b/9150bb8712d38f02ad8eb181e67367aee2b201c9" alt=""
s3d<-scatterplot3d(mtcars$wt,mtcars$disp,mtcars$mpg,
pch=16,
highlight.3d=TRUE,
type="h",
main="Basic 3D Scatter Plot")
fit<-lm(mtcars$mpg~mtcars$wt+mtcars$disp)
s3d$plane3d(fit)
data:image/s3,"s3://crabby-images/425c5/425c575dc89c9de46a0a0ad96a2335b0641f6c8f" alt=""
旋转三维散点图
rgl包中的plot3d()函数创建可交互的三维散点图
("rgl")
library(rgl)
attach(mtcars)
plot3d(mtcars$wt,mtcars$disp,mtcars$mpg,col="red",size=5)
data:image/s3,"s3://crabby-images/edeb1/edeb155579f042a0827524d9b39f5b6a231e61f8" alt=""
可通过鼠标旋转坐标轴
("Rcmdr")
library(Rcmdr)
attach(mtcars)
scatter3d(mtcars$wt,mtcars$disp,mtcars$mpg)
scatter3d()函数可包含各种回归曲面,比如线性、二次、平滑和附加等类型。
5.气泡图
思想:创建一个二维散点图,然后用点的大小来代表第三个变量的值。
可用symbols()函数来创建气泡图
attach(mtcars)
r<-sqrt(disp/pi)
symbols(mtcars$wt,mtcars$mpg,circler=r,inches=0.30,
fg="white",bg="lightblue",
main="Bubble Plot with point size proportional to displacement",
xlab="Weigt of Car(lbs/1000)",ylab="Miles Per Gallon")
text(wt,mpg,rownames(mtcars),cex=0.6)
detach(mtcars)
6.折线图
刻画变动的优秀工具
创建散点图和折线图
opar<-par(=TRUE)
par(mfrow=c(1,2))
t1<-subset(Orange,Tree==1)
plot(t1$age,t1$circumstance,
xlab="Age(days)",
ylab="Circmference(mm)",
main="Orange Tree 1 Growth")
plot(t1$age,t1$circumstance,
xlab="Age(days)",
ylab="Circmference(mm)",
main="Orange Tree 1 Growth",
type="b")
data:image/s3,"s3://crabby-images/6daa4/6daa41272f7ca1fc658c272d6deda391f202e117" alt=""
拆线图类型
类型 | 图形外形 |
p | 只有点 |
l | 只有线 |
o | 实心点和线(即线覆盖在点上) |
b、c | 线连接点(c时不绘制点) |
s、S | 阶梯线 |
h | 直方图式的垂直线 |
n | 不生成任何点和线(通常用来为后面的命令创建坐标) |
plot()和lines()函数工作原理不同,plot()被调用时即创建一幅新图,而lines()函数则是在已存在的图形上添加信息,并不能自己生成图形。
Orange$Tree<-(Orange$Tree)
ntrees<-max(Orange$Tree)
xrange<-range(Orange$age)
yrange<-range(Orange$circumference)
plot(xrange,yrange,
type="n",
xlab="Age(days)",
ylab="Circumstance(mm)")
colors<-rainbow(ntrees)
linetype<-c(1:ntrees)
plotchar<-seq(18,18+ntrees,1)
for(i in 1:ntrees){
tree<-subset(Orange,Tree==i)
lines(tree$age,tree$circumference,
type="b",
lwd=2,
lty=linetype[i],
col=colors[i],
pch=plotchar[i]
)
}
title("Tree Growth","example of line plot")
legend(xrange[1],yrange[2],
1:ntrees,
cex=.8,
col=colors,
pch=plotchar,
lty=linetype,
title="Tree")
data:image/s3,"s3://crabby-images/7f57c/7f57c16dfb7893c8d53b82ae8a726037ff77220a" alt=""
7.相关图
("seriation")
library(corrgram)
corrgram(mtcars,ordr=TRUE,=,
=,=,
main="Correlogram of mtcars intercorrelations")
data:image/s3,"s3://crabby-images/47521/475214decb361a844f1dc3fd37edf09e79812dfc" alt=""
默认地,蓝色和和从左下指向右上的斜杠表示单元格中的两个变量呈正相关;反过来,绝色和从左上指向右下的斜杠表示变量呈负相关。色彩越深,饱和度越高,说明变量相关性越大。
上三角单元格用饼图显示了相同的信息,颜色同上,但相关性大小由被填充的饼图块的大小来展示。正相关从12点钟处开始顺时针填充饼图,而负相关则是逆时针方向填充饼图。
corrgram()函数的panel选项
位置 | 面板选项 | 描述 |
非对角线 | 用饼图的填充比例来表示相关性大小 | |
用阴影的深度来表示相关性的大小 | ||
绘制置信椭圆和平滑拟合曲线 | ||
绘制散点图 | ||
主对角线 | 输出变量的最大最小值 | |
变量的名字 |
corrgram(mtcars,ordr=TRUE,=,
=NULL,=,
main="Correlogram of mtcars intercorrelations")
data:image/s3,"s3://crabby-images/53a4e/53a4e33c47c39e21b54b1b7dbb3debddba0d4a08" alt=""
8.马赛克图
·当变量是类别变量时,且数目多于三个的时候,可使用马赛克图。马赛克图中,嵌套矩阵面积正比于单元格频率,其中该频率即多维列联表中的频率。颜色和阴影可表示拟合模型的残差值。
vcd包中的mosaic()函数可以绘制马赛克图
base包中的mosaicplot()也可绘制马赛克图。
以 base中的Titanic数据集为例
ftable(Titanic)
library(vcd)
mosaic(Titanic,shade=TRUE,legend=TRUE)
data:image/s3,"s3://crabby-images/644cf/644cfea762a25b29197123079cca9970338c11e4" alt=""