numpy的mean(),std()等方法是作用于整个numpy数组的,如果是二维数组的话,也是整个数组,包括所有行和列,但我们经常需要它仅作用于行或者列,而不是整个二维数组,这个时候,可以定义轴axis:
axis=表示作用于列
axis=表示作用于行
以sum()求和方法为例:
import numpy as np a = np.array([
[1, 2, 3],
[4, 5, 6],
[7, 8, 9]
]) print a.sum()
# print a.sum(axis=0)
# 表示对各个列求和
# [12 15 18] print a.sum(axis=1)
# 表示对各个行求和
# [6 15 24]
一个综合栗子:
# 假设有如下5个地铁站10天的客流数据
ridership = np.array([
[ 0, 0, 2, 5, 0],
[1478, 3877, 3674, 2328, 2539],
[1613, 4088, 3991, 6461, 2691],
[1560, 3392, 3826, 4787, 2613],
[1608, 4802, 3932, 4477, 2705],
[1576, 3933, 3909, 4979, 2685],
[ 95, 229, 255, 496, 201],
[ 2, 0, 1, 27, 0],
[1438, 3785, 3589, 4174, 2215],
[1342, 4043, 4009, 4665, 3033]
])
首先计算各个车站每天的客流平均值,从中找出最大和最小值:
def min_and_max_riders_per_day(ridership):
mean_ridership_per_station = ridership.mean(axis=0)
max_daily_ridership = mean_ridership_per_station.max()
min_daily_ridership = mean_ridership_per_station.min()
return (max_daily_ridership, min_daily_ridership) print(min_and_max_riders_per_day(ridership)) # 结果
(3239.9, 1071.2)