1、R语言定义:
【百度百科】R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个*、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。
2、读数据:
data <- read.csv("文件名.csv",header=T,check.names=FALSE)
读入的而文件存在data.frame(数据框里面)
注意:此时数据框里面数据的类型可能是任意类型,可以用str(data)查看数据框的各个属性情况
3、数据处理:
数据类型属性:返回值为true或false
is.numeric() 是否数值型数据
is.character() 是否字符型数据
is.vector() 是否向量数据
is.matrix() 是否矩阵数据
is.data.frame() 是否数据框数据
is.factor() 是否因子数据
is.logical() 是否逻辑型数据
属性类型转换:返回相应的类型
as.numeric() 转化为数值类型
as.character() 转化为字符(字符串)类型
as.vector() 转化为向量类型
as.matrix() 转化为矩阵
as.data.frame() 转化为数据框
as.factor() 转化为因子
as.logical() 转化为逻辑
4、数据筛选:
直接选择某行某列,和矩阵一样:data[row1:row2,col1:col2] / data[ , ]
用which 语句 : data[[which(条件)],] ,如 data[which(data$name %in% MAP),](有时当条件值有几个重复数据的时候,只能选出出现的第一个数据,例如,data.frame中name “sun”对应的数据出现多次{}sun ming,sun zhe ,sun hhh},但是以“sun”作为筛选条件时,只能筛选出“sun ming”)
用sql语句:library(sqldf);res<-sqldf(" select * from data where 条件")
对于出现的筛选条件重复的情况下,可以采用filter():library(dplyr);res<- filter(data, 属性==条件)
as.numeric() 转化为数值类型
as.character() 转化为字符(字符串)类型
as.vector() 转化为向量类型
as.matrix() 转化为矩阵
as.data.frame() 转化为数据框
as.factor() 转化为因子
as.logical() 转化为逻辑