R语言基础概要

时间:2021-08-30 04:17:10

基于学习总结和网上收集!汇总供以后查看学习!

运算符

数学运算:

+,-,*,/,^,%%。(加,减,乘,除,乘方,求余。)

比较运算:

>,<,>=,<=,==,!=。
(大于,小于,大于等于,小于等于,等于,不等于。)

逻辑运算:

&,|,!。(与,或,非。)

初始基本操作

获取工作目录。


> getwd()

设定工作目录

setwd("")

寻求帮助

help(com)
?com
??con

查看实例

example(com)

查看变量格式

args()

列出已安装的包

library()

载入包

library(AER) 
require(AER)

获取包的信息

library(help = ggplot2)

去除载入的包ggplot2

detach(package:ggplot2)

列出已载入的包

search()

列出已载入的包中的所有数据集

data()

列出已安装的包中的所有数据集

data(package = .packages(all.available = TRUE))

列出包ggplot2里的所有数据集

try(data(package = "ggplot2") )

获取数据集的信息

 help(iris)

贴上数据集iris,其作用是可以直接对数据集里的变量进行操作。

attach(Affairs)

上述操作的逆操作

detach(Affairs)

一般的操作

列出所有对象

objects()
ls()

查看对象x的模式:空,数值,字符,逻辑,复数,列表,函数

(NULL,numeric,character,logical,complex,list,function)。

mode(x)

查看对象x的类型:除了mode里列出的几种类型外,还有整数,矩阵,因子,阵列,数据框,时间序列(integer,matrix,factor,array,data frame,ts)等其他类型。mode主要用于区别数据存放的方式,而class是一种更细微的分类方式,比如矩阵,就是一种更“有序”的数据存放方式。此命令比mode常用。

 class(x)

把对象x转为矩阵型

as.matrix(x)

把对象x转为数值型

as.numeric(x)

查看对象x的结构,str是structure的缩写

 str(x)

移除对象x

 rm(x)

移除所有对象

rm(list=ls(all=TRUE))
rm(list=ls())

与向量有关的操作

生成向量

x = c(1,2,4)

#生成元素依次为”a”,”b”,”cd”的字符向量x

 x = c("a","b","cd")

生成”a b cd”的字符x

 x = paste("a","b","cd")

向量x的第a到b个元素

x[a:b]

剔除向量x第i个元素所得的向量

x[-i]

向量x的长度

length(x)

生成以一个n维数值型向量x,第一个元素为a,最后一个元素为b,中间元素依次等距递增。(假设a

x = seq(a, b, length = n)

生成一个数值型向量x,第一个元素为a,其后元素依次加c,直到最后一个元素加c大于b。(假设a

x = seq(a, b, c)

从1开始生成一个递增或递减数值型向量x,最后一个元素绝对值为小于等于|a|的最大整数。

x = seq(a)

生成一个从a递增(减)到b的数值型向量x。(a和b都是整数)

x = a:b

对向量v进行n次复制生成新的向量x

x = rep(v, n)

依次对向量v的每个元素复制n此生成新的向量x

x = rep(v, each = n)

生成一个向量x,其中每个元素是v对应元素的最近整数

x = round(v)

排序

order(x)

获得向量x每个元素大小位置

rank(x)

对向量x从小到大进行排序。降序:sort(x, decreasing = TRUE)。

sort(x)

根据因子f对向量x分类执行函数g

 tapply(x,f,g)

向量x按因子f分类

split(x,f)

返回向量x的差分向量

 diff(x)

返回向量x的累加向量

 cumsum(x)

与矩阵有关的基本操作

生成m行n列的0矩阵

 M = matrix(0,c(m,n))

按行合并矩阵X和Y形成新矩阵M。(X和Y列数需相同)

> M = rbind(X,Y)

按列合并矩阵X和Y形成新矩阵M。(X和Y行数需相同)

> M = cbind(X,Y)

矩阵M的列名

> colnames(M)

矩阵M的行名

> rownames(M)

矩阵M的行数

> nrow(M)

矩阵M的列数

> ncol(M)

矩阵M的对角线元素形成的向量

> diag(M)

生成以向量x为对角线元素,其他位置元素为0的矩阵M

> M = diag(x)

矩阵M的维度

> dim(M)

矩阵M第i行。(数值型)

> M[i,]

矩阵M第i行。(矩阵型)

> M[i,,drop = FALSE]

删除第i行

> M = M[-i,]

矩阵M第j列

> M[,j]

矩阵M第i行j列元素

> M[i,j]

矩阵M的转置。若M为数值型向量,则t(M)为矩阵型行向量

> t(M)

矩阵X乘矩阵Y。若Y是数值型的向量,R会自动判断其为行向量还是列向量。若X与Y为维度匹配的数值型向量,则返回的是矩阵型向量的内积

> X%*%Y

数值型向量x与y的外积(矩阵型)

> x%o%y

矩阵X与矩阵Y的Hadamard乘积。加、减、除、求余的规则和乘相同,即相同位置的元素进行运算

> X*Y

求矩阵M的特征值和特征向量

> eigen(M)$val
> eigen(M)$vec

矩阵M求逆

> solve(M)

求解线性方程Ax=b

> solve(A,b)

对矩阵M的行(dimcode=1)或列(dimcode=2)依次进行函数f操作,f的变量(arguments)方正fargs里

> apply(M, dimcode, f, fargs)

与列表有关的基本操作

建立列表L

> L = list(a = , b = , c = ,...)

返回列表L里的对象a

> L$a
> L[[a]]

去除列表L里的对象a

> L$a = NULL

列出列表L里的对象名

> names(L)

去掉列表L里的对象名

> unname(L)

list apply。功能与apply类似(参考上面的apply),用于列表型数据

> lapply(...)

simplified apply。功能与lapply类似,区别在于函数结果的类型不是列表(list)

> sapply(...)

与数据框有关的基本操作

数据框是一种特殊的列表,所以对列表适用的函数往往对数据框也适用。此外,数据框也有矩阵型数据的特征,所以一些适用于矩阵型数据的函数,不如rbind,cbind,apply等也可以作用在数据框上。

创建数据框Data

> Data = data.frame(...)

编辑数据框Data

> fix(Data)

显示数据框Data的前几行

> head(Data)

列出数据框Data的组成部分

> attribute(Data)

显示数据框Data的变量名

> names(Data)

显示数据框Data的行名

> row.names(Data)

数据框Data中名为name1的变量

> Data$name1

数据框Data中第i个变量形成的数据框

> Data[i]

合并数据框D1和D2,需要D1和D2中有至少一个相同的变量

> merge(D1,D2)

与逻辑型数据有关的基本操作

判断是否对象x是数据框

> is.data.frame(x)

判断是否对象x的每个元素都大于a

> all(x>a)

判断对象x的元素中是否存在一个大于a

> any(x>a)

判断x的每个元素是否大于y的每个元素

> x>y

向量x中大于a的元素组成的新向量

> x[x>a]

向量x中大于a的元素组成的新向量。与上面例子的区别在于若向量元素里有NA,上面的例子会保留在结果中,而subset命令会剔除掉

> subset(x, x>a)

返回向量中大于a的元素的位置

> which(x, x>a)

生成一个与b(逻辑向量)维度相同的数值向量,若b[i]为TRUE,则x[i]为u,反之为v

x = ifelse(b, u, v)