详解R语言数据合并一行代码搞定

时间:2021-07-16 14:07:14

数据的合并

需要的函数

?
1
cbind(),rbind(),bind_rows(),merge()

准备数据

我们先构造一组数据,以便下面的演示

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
> data1<-data.frame(
+  namea=c("海波","立波","秀波"),
+  value=c("一波","接","一波")
+ )
> data1
 namea value
1 海波 一波
2 立波  接
3 秀波 一波
> data2<-data.frame(
+  nameb=c("柯震东","刘强东","何盛东"),
+  value=c("东去","又","东来")
+ )
> data2
  nameb value
1 柯震东 东去
2 刘强东  又
3 何盛东 东来

按列合并

?
1
2
3
4
5
> cbind(data1,data2)
 namea value nameb value
1 海波 一波 柯震东 东去
2 立波  接 刘强东  又
3 秀波 一波 何盛东 东来

按行合并

按列合并是cbind(),那么按行合并自然是rbind()

?
1
2
> rbind(data1,data2)
Error in match.names(clabs, names(xi)) : 名字同原来已有的名字不相对

出现了错误,这是因为”namea“ 和”nameb“不同造成的,如果都为"namea" :

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
> data1<-data.frame(
+  namea=c("海波","立波","秀波"),
+  value=c("一波","接","一波")
+ )
> data1
 namea value
1 海波 一波
2 立波  接
3 秀波 一波
> data2<-data.frame(
+  namea=c("柯震东","刘强东","何盛东"),
+  value=c("东去","又","东来")
+ )
> data2
  namea value
1 柯震东 东去
2 刘强东  又
3 何盛东 东来
> #cbind(data1,data2)
> rbind(data1,data2)
  namea value
1  海波 一波
2  立波  接
3  秀波 一波
4 柯震东 东去
5 刘强东  又
6 何盛东 东来

对数据修改后,没有出现错误。如果 不修改数据该怎么做:

​ 为了解决这个问题,使用dplyr包中的bind_rows()函数,不要求合并字段的名称必须相同,这个函数会自己做判断。

?
1
2
3
4
5
6
7
8
9
> library(dplyr)
> dplyr::bind_rows(data1,data2)
 namea value nameb
1 海波 一波  <NA>
2 立波  接  <NA>
3 秀波 一波  <NA>
4 <NA> 东去 柯震东
5 <NA>  又 刘强东
6 <NA> 东来 何盛东

merge()

?
1
2
3
4
5
merge(x, y, by = intersect(names(x), names(y)),
   by.x = by, by.y = by, all = FALSE,
   all.x = all, all.y = all,
   sort = TRUE, suffixes = c(".x",".y"),
   incomparables = NULL, ...)

merge函数参数的说明:

  • x,y:用于合并的两个数据框
  • by,by.x,by.y:指定依据哪些行合并数据框,默认值为相同列名的列.
  • all,all.x,all.y:指定x和y的行是否应该全在输出文件.
  • sort:by指定的列是否要排序.
  • suffixes:指定除by外相同列名的后缀.
  • incomparables:指定by中哪些单元不进行合并.

演示merge()

?
1
2
3
4
5
6
7
8
9
10
11
12
data3<-data.frame(
 name = c("波","东","波","波"),
 type = c("秀","震","秀","秀"),
 class = c(10,5,4,11),
 num = c(85,50,90,90)
);data3
data4<-data_frame(
 name = c("波","东"),
 type = c("海","震"),
 class = c(5,5),
 num = c(88,81)
);data4
?
1
2
3
4
5
6
7
8
9
#合并data3和data4
> merge(data3,data4,all =T)
 name type class num
1  波  秀   4 90
2  波  秀  10 85
3  波  秀  11 90
4  波  海   5 88
5  东  震   5 50
6  东  震   5 81
?
1
2
3
4
5
6
7
8
#按照name,type,class合并data3.data4
> merge(data3, data4, by =c("name","type","class") , all = T)
 name type class num.x num.y
1  波  秀   4  90  NA
2  波  秀  10  85  NA
3  波  秀  11  90  NA
4  波  海   5  NA  88
5  东  震   5  50  81

到此这篇关于详解R语言数据合并一行代码搞定的文章就介绍到这了,更多相关R语言数据合并内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家!

原文链接:https://blog.csdn.net/sinat_30361015/article/details/86702618