每每以为攀得众山小，可、每每又切实来到起点，大牛们，缓缓脚步来俺笔记葩分享一下吧，please~ R语言︱排序问题

———————————————————————————

数据排序

1、sort()，rank()，order()函数

Sort	排序（默认升序，decreasing=T时为降序）
Order	排序（默认升序，decreasing=T时为降序）

在R中，和排序相关的函数主要有三个：sort()，rank()，order()。

sort(x)是对向量x进行排序，返回值排序后的数值向量。rank()是求秩的函数，它的返回值是这个向量中对应元素的“排名”。而order()的返回值是对应“排名”的元素所在向量中的位置。

下面以一小段R代码来举例说明：

[plain] view plain copy

print ? R语言︱排序问题

x<-c(97,93,85,74,32,100,99,67)
sort(x)
[1] 32 67 74 85 93 97 99 100
order(x) #order()的返回值是各个排名的学生成绩所在向量中的位置
[1] 5 8 4 3 2 1 7 6
rank(x) #rank()的返回值是这组学生所对应的排名
[1] 6 5 4 3 1 8 7 2

深入理解一下:

sort（）在单变量排序中，效果较好；

order()≈原序号(sort()) 因为可以标记排序好之后的下标，在数据框中的排序操作，实用性超强，可以实现：

1、整个数据集按照某个变量（比如：按月份大小）排序；

2、整个数据集其中某个变量依据第二个变量（比如：月份）排序。

iris;iris[1:10,]
names(iris)

#单数据列，两者相同
sort(iris$Sepal.Length)
iris$Sepal.Length[order(iris$Sepal.Length)] 

#多数据列，order有奇效
iris[order(iris$setosa),]                 #按照setosa的大小，重排整个数据集
iris$Sepal.Length[order(iris$setosa)]     #按照照setosa的大小，重排Sepal.Length数据列
iris[order(iris$setosa),]$Sepal.Length    #与上句异曲同工

与which有一些地方的相似，which可以实现返回服从条件观测的行数。which又与subset子集筛选有关。（详见which、subset子集筛选用法）

data$V1[which(data$V2<0)]                 #筛选出V1中，V2小于0的数字，跟order的作用些许相似
#order用法
iris$Sepal.Length[order(iris$setosa)]     #按照照setosa的大小，重排Sepal.Length数据列

2、dplyr包的一些应用

[plain] view plain copy

print ? R语言︱排序问题

#dplyr中基本函数 arrange——数据排序
Hdma_dat[order(Hdma_dat$survived),] #传统方法用order排序
arrange(Hdma_dat,survived) #将survived从小到大排序
arrange(Hdma_dat,desc(survived) #将survived从大到小排序
arrange(Hdma_dat,pclass,desc(survived) #先将pclass从小到大排序，再在那个数据基础上让survived从大到小排序

每每以为攀得众山小，可、每每又切实来到起点，大牛们，缓缓脚步来俺笔记葩分享一下吧，please~ R语言︱排序问题

———————————————————————————

秒客网

R语言︱排序问题

数据排序

相关文章