前言:
此文章仅供自己使用,学习笔记记录。
视频教程学习记录:
视频地址:数据分析与R语言视频教程+课件。
书籍学习笔记:
书籍:《统计建模与R软件》(薛毅编著)
R树笔记:
- 指数:2**3或者2^3。
- exp()指数;sqrt()开根号;range()范围,得到最小值和最大值;prod()求向量各分量的连乘积。
- 中位数:median()、均值:mean()、方差:var()、标准差sd()
- 等差数列:
> 2.34:5
[1] 2.34 3.34 4.34
- 等间隔函数:
> seq(from=2, to=5, by=0.5)
[1] 2.0 2.5 3.0 3.5 4.0 4.5 5.0
> seq(2, 5, by=1)
[1] 2 3 4 5
- 缺失值:
> z = c(1:3, NA);z
[1] 1 2 3 NA
> is.na(z)
[1] FALSE FALSE FALSE TRUE
> z[is.na(z)] = 10;z
[1] 1 2 3 10
以下为2015.7.16更新
参数:
- x, y, xmin, xmax, ymin, ymax, xend, yend, data, xlim, ylim, xlab, ylab, asp,sep间隔
- facets:图形/数据的分面。它把数据按某种规则进行分类,每一类数据做一个图形,所以最终效果就是一页多图
- margins:是否显示边界
- position: 图形或者数据的位置调整
- color:线条颜色
- fill:填充颜色
- alpha:透明度
- angle:角度
- size:点或者线的宽度
- vjust:纵向位置,hjust:横向位置
- shape:形状
- group:分组
- geom: 图形的几何类型(geometry),ggplot2用几何类型表示图形类别,比如point表示散点图、line表示曲线图、bar表示柱形图等
- stat: 统计类型(statistics),直接将数据统计和图形结合
- aes:图形的可视属性如形状、颜色、透明度等称为美学属性(或艺术属性),确定数据与美学属性之间对应关系的过程称为映射
-
coord:坐标系
http://www.tuicool.com/articles/nUf2ae
函数:
- exp()指数;sqrt()开根号;range()范围,得到最小值和最大值
- prod()求向量各分量的连乘积;median()中位数;mean()均值;var()方差;sd()标准差。
- unique(dt$DOCTOR):求DOCTOR列的元素(唯一)
- tapply(dtDOCTOR, sum):依据DOCTOR字段不同,对PAID求和
- apply(x,2,min):对数据框x求列的min;apply(x,1,max):对数据框x求行的max。(margin为1表示行,2表示列)
- d.sub <- diamonds[sample(nrow(diamonds), 500), ]:取500个样本
- mean() 求平均值;var() 求方差反映离散程度;prod() 求阶乘
- iris[which(iris$Species==’setosa’), 1:2]
- rbind()行合并,cbind列合并。
- head(数据框):显示数据框的前几列。
- 排序:sort()、order()、sort.list()
- rep(1, 10):将1复制10次,得到10个1
- seq():等间隔函数seq(from=2, to=5, by=0.5)得到[1] 2.0 2.5 3.0 3.5 4.0 4.5 5.0
- rownames():求数据框或者矩阵的列名
- colnames():求数据框或者矩阵的行名
vector向量,factor因子,array数组,matrix矩阵,data frame数据框,time series时间序列,list列表
point散点图,line曲线图,smooth平滑曲线,jitter另一种散点图,boxplot箱线图,histogram直方图,density密度分布图,bar柱状图