学习R有一周了,心中一直有一个困惑,关于= 和 <-,今晚决定搞定它!
迄今为止用到最多的函数是matrix() 和c(),就用他们说起!
之前学了四五门语言,对于=赋值已经成了惯性,下面是我的习惯写法:
matrix(1:6,nrow = 2,ncol = 3,byrow = FALSE) #有时候写成 byrow = F ,但发现错了,缩写的FALSE导致这个参数设置无效。
可实际上还有另外一种用<-的才是书中常用的写法:
matrix(1:6,nrow <- 2,ncol <- 3,byrow <- FALSE)
Rstudio里面F1得到帮助文档是这样的:
matrix(data = NA, nrow = 1, ncol = 1, byrow = FALSE, dimnames = NULL)
因此本文的目标在于总结这两种用法的区别和注意的地方。
上代码:
# 函数要求参数类型-----更特殊的情况,
#函数定义:system.time(expr, gcFirst = TRUE)
system.time(x = 100) #问题一:执行失败,为什么?
## Error: 参数((x = 100)) 没有用
system.time(x <- 100) #执行成功
## user system elapsed
## 0 0 0
解答1:
1. <-箭头是表达式,而=等号仅为赋值语句而非表达式。
2. 作为函数参数使用时,使用<-箭头表达式的话,会自动在用户空间栈创建相应的变量,而=等号则没有此项动作。
3.<-箭头用作为函数设置参数使用时,由于其表达式(exp)的特性,实际上是有两步动作,
1.执行表达式
2.将结果当做匿名参数传递给函数。注意是匿名参数,接下来的例子还要讲到。
matrix(1:6, 3, TRUE) #问题2:本意是,给出3,他应该知道自己除以下得到列数,结果却与预期不符, 少了1列,为什么
## [,1]
## [1,] 1
## [2,] 2
## [3,] 3
matrix(1:6, 3, 2, TRUE)
## [,1] [,2]
## [1,] 1 2
## [2,] 3 4
## [3,] 5 6
解答2:
1.解释器按照matrix函数定义的顺序index,对参数进行解释分析。
2.解释器对于 匿名参数会自动将TRUE 转换成 1, 将False转换成 0
# 不照函数定义的参数顺序来设置 nrow 和 ncol 属性。
matrix(1:6, byrow = FALSE, 3) #问题3:参数不按定义也行的通,为什么?
## [,1] [,2]
## [1,] 1 4
## [2,] 2 5
## [3,] 3 6
matrix(1:6, byrow <- FALSE, 2) #错误,参见问题2
matrix(1:6, byrow = FALSE, 2) #不按照参数顺序,给出nrow = 2,自动得到3列
## [,1] [,2] [,3]
## [1,] 1 3 5
## [2,] 2 4 6
matrix(1:6, byrow <- TRUE, 2) #只得到一行,原因见 问题2.
解答3:
1.当使用=时,命名参数提前,但是解释器将会忽略其index,因此,解释依然正确。
2.当使用<-时,相当于是匿名参数。
#使用<-,并打乱参数的位置,无名参数将会自动排除之前的命名参数
matrix(1:6, ncol <- 2, nrow <- 3, byrow = TRUE) #问题4:设置col为2,结果却为3,为什么?
## [,1] [,2] [,3]
## [1,] 1 2 3
## [2,] 4 5 6
matrix(1:6, ncol <- 3, nrow <- 2, byrow = TRUE) #设置col为3,结果输出却为2,为什么?
## [,1] [,2]
## [1,] 1 2
## [2,] 3 4
## [3,] 5 6
解答4:
使用<- 相当于是匿名参数,不过在当前用户空间多了一个新的变量而已。
# 这还不够,下面继续!
matrix(1:6, ncol = 2, nrow = 3, byrow = TRUE) #问题5:参数逆序也可以,结果与预期一致,3是3,2归2,没错。,但为什么?
## [,1] [,2]
## [1,] 1 2
## [2,] 3 4
## [3,] 5 6
matrix(1:6, ncol = 3, nrow = 2, byrow = TRUE) #与预期一致。
## [,1] [,2] [,3]
## [1,] 1 2 3
## [2,] 4 5 6
解答5: 命名参数可以不按照函数参数顺序排列,随意。
# 问题6:下面代码的区别是什么?(<-的孤立点问题)
# code seg 1
x = 1
fun = function(x) return(TRUE)
fun(x = x + 1);x
## [1] TRUE
## [1] 1 #x的值未改变
fun(x <- x + 2);x
## [1] TRUE
## [1] 1
# code seg 2
x = 1
fun = function(x) {
x
return(TRUE)
}
fun(x = x + 1);x
## [1] TRUE
## [1] 1 #依然未改变
fun(x <- x + 2);x
## [1] TRUE
## [1] 3 #变成3
解答6:
这是R 变态的地方,也是它主动优化的结果,当函数定义被解释器分析时,若发现参数未被函数体内任何代码引用,则此参量不会被真正地传递执行。即使其使用<-箭头表达式。
#再总结:
<- 和 = 的区别在于当参数使用时,参数存在匿名参数、命名参数两大类。
1.当使用=时,命名参数提前,但是解释器将会忽略其index,因此,解释依然正确。
2.当使用<-时,相当于是匿名参数。不过在当前用户空间多了一个新的变量而已。
3. <-箭头是表达式,而=等号仅为赋值语句而非表达式。
4. 作为函数参数使用时,使用<-箭头表达式的话,会自动在用户空间栈创建相应的变量,而=等号则没有此项动作。
5.<-箭头用作为函数设置参数使用时,由于其表达式(exp)的特性,实际上是有两步动作,
1.执行表达式
2.将表达式的结果当做匿名参数传递给函数。
6.当传递的参数都为匿名参数时,解释器按照matrix函数定义的顺序index,对参数进行解释分析,并不会对变量类型进行检测后对号入座,
如果可以,它倒是会自动转换类型以适应目标位置的类型。如:使用False 和 true时,碰到类型不匹配的地方,解释器会自动将TRUE 转换成 1, 将False转换成 0
7:命名参数可以不按照函数参数顺序排列,可随意。
8:这是R 变态的地方,也是它主动优化的结果,当函数定义被解释器分析时,若发现参数未被函数体内任何代码引用,则此参量不会被真正地传递执行。即使其使用<-箭头表达式。
reference:
1.http://bbs.pinggu.org/thread-1247151-1-1.html
2.http://yihui.name/cn/2012/09/equal-and-arrow/
3.http://f.dataguru.cn/forum.php?m ... 824&page=2#pid87934
4.http://cran.r-project.org/doc/manuals/R-lang.html#Argument-matching