R语言对数据的部分操作

时间:2022-07-28 01:49:41

1、R语言定义:

【百度百科】R是用于统计分析绘图的语言和操作环境。R是属于GNU系统的一个*、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具

2、读数据:

data <- read.csv("文件名.csv",header=T,check.names=FALSE) 

读入的而文件存在data.frame(数据框里面)

    注意:此时数据框里面数据的类型可能是任意类型,可以用str(data)查看数据框的各个属性情况

3、数据处理:

数据类型属性:返回值为true或false

is.numeric()   是否数值型数据

is.character()   是否字符型数据 

is.vector()   是否向量数据

is.matrix()   是否矩阵数据

is.data.frame()   是否数据框数据

is.factor()    是否因子数据

is.logical()   是否逻辑型数据

属性类型转换:返回相应的类型



as.numeric()       转化为数值类型

as.character()     转化为字符(字符串)类型

as.vector()          转化为向量类型

as.matrix()           转化为矩阵

as.data.frame()     转化为数据框

as.factor()             转化为因子

as.logical()            转化为逻辑

4、数据筛选:

      直接选择某行某列,和矩阵一样:data[row1:row2,col1:col2] / data[ , ]

     用which 语句 : data[[which(条件)],]  ,如 data[which(data$name %in% MAP),](有时当条件值有几个重复数据的时候,只能选出出现的第一个数据,例如,data.frame中name “sun”对应的数据出现多次{}sun  ming,sun zhe ,sun hhh},但是以“sun”作为筛选条件时,只能筛选出“sun ming”)

     用sql语句:library(sqldf);res<-sqldf(" select * from data where 条件")

     对于出现的筛选条件重复的情况下,可以采用filter():library(dplyr);res<- filter(data, 属性==条件)





as.numeric()       转化为数值类型

as.character()     转化为字符(字符串)类型

as.vector()          转化为向量类型

as.matrix()           转化为矩阵

as.data.frame()     转化为数据框

as.factor()             转化为因子

as.logical()            转化为逻辑