reindex更多的不是修改pandas对象的索引,而只是修改索引的顺序,如果修改的索引不存在就会使用默认的None代替此行。且不会修改原数组,要修改需要使用赋值语句。
series.reindex()
1
2
3
4
|
import pandas as pd
import numpy as np
obj = pd.Series( range ( 4 ), index = [ 'd' , 'b' , 'a' , 'c' ])
print obj
|
1
2
3
4
5
|
d 0
b 1
a 2
c 3
dtype: int64
|
1
2
3
4
5
6
7
8
|
print obj.reindex([ 'a' , 'b' , 'c' , 'd' , 'e' ])
1
a 2.0
b 1.0
c 3.0
d 0.0
e NaN
dtype: float64
|
多出的索引‘e'会被赋值NaN
内插或填充method
1
2
|
obj1 = pd.Series( range ( 3 ), index = [ 'a' , 'c' , 'e' ])
print obj1.reindex([ 'a' , 'b' , 'c' , 'd' , 'e' ],method = 'pad' )
|
1
2
3
4
5
6
|
a 0
b 0
c 1
d 1
e 2
dtype: int64
|
ffill或pad: 前向(或进位)填充
bfill或backfill: 后向(或进位)填充
dataframe.reindex()
dataframe.reindex()可以改变(行)索引,列或两者。当只传入一个序列时,行被重新索引,一次可以对两个重新索引,可是插值只在行侧(0坐标轴)进行
1
2
|
frame = pd.DataFrame(np.arange( 9 ).reshape(( 3 , 3 )), index = [ 'a' , 'c' , 'd' ], columns = [ 'c1' , 'c2' , 'c3' ])
print frame
|
1
2
3
4
|
c1 c2 c3
a 0 1 2
c 3 4 5
d 6 7 8
|
1
2
|
states = [ 'c1' , 'b2' , 'c3' ]
frame.reindex(columns = states)
|
c1 | b2 | c3 | |
---|---|---|---|
a | 0 | NaN | 2 |
c | 3 | NaN | 5 |
d | 6 | NaN | 8 |
列名不一样的会被赋值nan
1
2
|
frame_na = frame.reindex(index = [ 'a' , 'b' , 'c' , 'd' ], method = 'ffill' , columns = states)
print frame_na
|
1
2
3
4
5
|
c1 b2 c3
a 0 NaN 2
b 0 NaN 2
c 3 NaN 5
d 6 NaN 8
|
插值只在行侧(0坐标轴)进行,但是我们可以在其之后,对nan值进行填充
1
|
frame_na.fillna(method = 'ffill' ,axis = 1 )
|
c1 | b2 | c3 | |
---|---|---|---|
a | 0.0 | 0.0 | 2.0 |
b | 0.0 | 0.0 | 2.0 |
c | 3.0 | 3.0 | 5.0 |
d | 6.0 | 6.0 | 8.0 |
以上这篇python pandas 对series和dataframe的重置索引reindex方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/LY_ysys629/article/details/55005201