在进行数据操作时, 经常会碰到基于同一列进行错位相加减的操作, 即对某一列进行向上或向下平移(shift).
往常, 我们都会使用循环进行操作, 但经过查阅相关资料, 发现结合pandas里的groupby和shift两个函数就能轻松实现上述要求.
1
2
|
#创建样例数据
temp = pd.DataFrame({ 'id' :[ 1 , 1 , 1 , 2 , 2 , 3 ], 'value' :[ 1 , 2 , 3 , 4 , 5 , 6 ]});temp
|
1
2
3
4
5
6
7
8
|
Out[ 1 ]:
id value
0 1 1
1 1 2
2 1 3
3 2 4
4 2 5
5 3 6
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
temp[ 'value_shift' ] = temp.groupby( 'id' )[ 'value' ].shift( 1 );temp
Out[ 180 ]:
id value value_shift
0 1 1 NaN
1 1 2 1.0
2 1 3 2.0
3 2 4 NaN
4 2 5 4.0
5 3 6 NaN
temp[ 'value_shift_1' ] = temp.groupby( 'id' )[ 'value' ].shift( - 1 );temp
Out[ 181 ]:
id value value_shift value_shift_1
0 1 1 NaN 2.0
1 1 2 1.0 3.0
2 1 3 2.0 NaN
3 2 4 NaN 5.0
4 2 5 4.0 NaN
5 3 6 NaN NaN
|
通过shift函数里面的值来控制向前还是向后偏移, 缺少的值会填充NaN.
groupby函数里的参数控制基于什么字段进行shift.
官方文档 这里是以index为基准.
以上这篇python对列进行平移变换的方法(shift)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/kizgel/article/details/78333833