Pandas主要统计特征函数:
方法名 | 函数功能 |
---|---|
sum() | 计算数据样本的总和(按列计算) |
mean() | 计算数据样本的算术平均数 |
var() | 计算数据样本的方差 |
std() | 计算数据样本的标准差 |
corr() | 计算数据样本的Spearman(Pearman)相关系数矩阵 |
cov() | 计算数据样本的协方差矩阵 |
skew() | 样本值的偏度(三阶矩) |
kurt() | 样本值的峰度(四阶矩) |
describe() | 给出样本的基本描述(基本统计量如均值、标准差等) |
cum累积计算函数
cum系列函数是作为DataFrame或Series对象的方法出现的,因此命令格式为D.cumsum()
方法名 | 函数功能 |
---|---|
cumsum() | 依次给出前1、2、… 、n个数的和 |
cumprod() | 依次给出前1、2、… 、n个数的积 |
cummax() | 依次给出前1、2、… 、n个数的最大值 |
cummin() | 依次给出前1、2、… 、n个数的最小值 |
计算出前n项和:
1
2
3
4
5
6
7
8
9
|
D = pd.Series( range ( 0 , 20 ))
D.cumsum()
0 0
1 1
2 3
3 6
....
19 190
dtype: int64
|
rolling滚动计算函数
rolling_系列是pandas的函数,不是DataFrame或Series对象的方法,其格式为pd.rolling_mean(D,k),其中每k列计算一次平均值,滚动计算。
方法名 | 函数功能 |
---|---|
rolling_sum() | 计算数据样本的总和(按列计算) |
rolling_mean() | 数据样本的算术平均数 |
rolling_var() | 计算数据样本的方差 |
rolling_std() | 计算数据样本的标准差 |
rolling_corr() | 计算数据样本的Spearman(Pearman)相关系数矩阵 |
rolling_cov() | 计算数据样本的协方差矩阵 |
rolling_skew() | 样本值的偏度(三阶矩) |
rolling_kurt() | 样本值的峰度(四阶矩) |
依次对相邻两项求和:
1
2
3
4
5
6
7
8
9
|
pd.rolling_sum(D, 2 )
0 NaN
1 1.0
2 3.0
3 5.0
4 7.0
....
19 37.0
dtype: float64
|
以上这篇Pandas_cum累积计算和rolling滚动计算的用法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/starter_____/article/details/81517389