一、sort_values()函数用途
pandas中的sort_values()函数原理类似于SQL中的order by,可以将数据集依照某个字段中的数据进行排序,该函数即可根据指定列数据也可根据指定行的数据排序。
二、sort_values()函数的具体参数
用法:
1
|
DataFrame.sort_values(by = ‘ ##',axis=0,ascending=True, inplace=False, na_position=‘last')
|
参数说明
参数 | 说明 |
---|---|
by | 指定列名(axis=0或'index')或索引值(axis=1或'columns') |
axis | 若axis=0或'index',则按照指定列中数据大小排序;若axis=1或'columns',则按照指定索引中数据大小排序,默认axis=0 |
ascending | 是否按指定列的数组升序排列,默认为True,即升序排列 |
inplace | 是否用排序后的数据集替换原来的数据,默认为False,即不替换 |
na_position | {‘first',‘last'},设定缺失值的显示位置 |
三、sort_values用法举例
创建数据框
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
#利用字典dict创建数据框
import numpy as np
import pandas as pd
df = pd.DataFrame({ 'col1' :[ 'A' , 'A' , 'B' ,np.nan, 'D' , 'C' ],
'col2' :[ 2 , 1 , 9 , 8 , 7 , 7 ],
'col3' :[ 0 , 1 , 9 , 4 , 2 , 8 ]
})
print (df)
>>>
col1 col2 col3
0 A 2 0
1 A 1 1
2 B 9 9
3 NaN 8 4
4 D 7 2
5 C 7 8
|
依据第一列排序,并将该列空值放在首位
1
2
3
4
5
6
7
8
9
10
|
#依据第一列排序,并将该列空值放在首位
print (df.sort_values(by = [ 'col1' ],na_position = 'first' ))
>>>
col1 col2 col3
3 NaN 8 4
0 A 2 0
1 A 1 1
2 B 9 9
5 C 7 8
4 D 7 2
|
依据第二、三列,数值降序排序
1
2
3
4
5
6
7
8
9
10
|
#依据第二、三列,数值降序排序
print (df.sort_values(by = [ 'col2' , 'col3' ],ascending = False ))
>>>
col1 col2 col3
2 B 9 9
3 NaN 8 4
5 C 7 8
4 D 7 2
0 A 2 0
1 A 1 1
|
根据第一列中数值排序,按降序排列,并替换原数据
1
2
3
4
5
6
7
8
9
10
11
12
|
#根据第一列中数值排序,按降序排列,并替换原数据
df.sort_values(by = [ 'col1' ],ascending = False ,inplace = True ,
na_position = 'first' )
print (df)
>>>
col1 col2 col3
3 NaN 8 4
4 D 7 2
5 C 7 8
2 B 9 9
1 A 1 1
0 A 2 0
|
按照索引值为0的行,即第一行的值来降序排序
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
x = pd.DataFrame({ 'x1' :[ 1 , 2 , 2 , 3 ], 'x2' :[ 4 , 3 , 2 , 1 ], 'x3' :[ 3 , 2 , 4 , 1 ]})
print (x)
#按照索引值为0的行,即第一行的值来降序排序
print (x.sort_values(by = 0 ,ascending = False ,axis = 1 ))
>>>
x1 x2 x3
0 1 4 3
1 2 3 2
2 2 2 4
3 3 1 1
x2 x3 x1
0 4 3 1
1 3 2 2
2 2 4 2
3 1 1 3
|
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持服务器之家。
原文链接:https://www.cnblogs.com/avivi/p/10813318.html