R语言的学习笔记 (持续更新.....)

时间:2024-01-06 09:42:02

1. DATE 处理

1.1 日期格式一个是as.Date(XXX) 和strptime(XXX),前者为Date格式,后者为POSIXlt格式

1.2 用法:as.Date(XXX,"%Y/%m/%d %H:%M") ,strptime(XXX, format="%m%d%Y %H:%M")

1.3格式里的Y 为yy(i.e.: 15/01/02) , 格式里的y为yyyy(i.e.:2015/01/02)

2. 一些常用属性

2.1 输出列名:colnames()

2.2 过滤:subset(xxx,xxx$yyy==??) 或者 abc<-abc[abc$x>5,]

2.3 升序,降序为列前加负号:a[order(a[,1]),]

2.4 包含型过滤:a[a$Group.2 %in% c("PO. Manual Miss","Product Issue"),] # in需要加%%

2.5 聚合函数:aggregate(x,by=list(),FUN) #length = count,sum=sum,average=mean

2.6 返回文件名:dir(".",pattern = "*txt$")

3. 字符串处理

3.1 连接字符串paste(X,Y,sep="")

3.2 字符数量:nchars

3.3 分割字符串:strsplit(x,split="") ##返回类型为LIST

4.数据框和因子

4.1 merge(data.frame,data.frame,all=T) # full join 效果

4.2 factor(wm$Product.Version,levels=c("Before Everest ","Everest","Pluto","Pluto Patch","7004","7005")) #因子排序

4.3 rbind要注意学需要bind的列名必须一致否则会报名字同原来已有的名字不相对

4.4 levels(x) # 输出所有因子

推荐几个比较好用的R语言学习论坛:

http://www.nabble.com/   /*英文的R语言论坛,基本上都能找到相关的提问*/

http://cos.name/cn/   /* 统计之都,大家都懂的 */