前言:数组广播是学习numpy和tensorflow等数学运算的基础,但是很多文章解释得不清楚,本文做一个全面的总结。
Numpy的广播规则
广播的前提——两个数组必须可以转化成维度大小一模一样的才可以运算:
规则1:如果两个数组的维度不相同,那么小维度数组的形状将会在最左边补1.
规则2:如果两个数组的形状在任何一个维度上都不匹配,那么数组的形状会沿着维度为1扩展以匹配另外一个数组的形状。
规则3:如果两个数组的形状在任何一个维度上都不匹配并且没有任何一个维度为1,那么会引起异常。
为了更清楚的理解这些规则看,来看几个具体的示例。
(1)示例1
#两个数组的形状为 a.shape=(2,3),b.shape=(3,)
#可以看到,根据规则1,数组a的维度更小,所以在其左边补1,变为a.shape -> (2,3), b.shape -> (1,3)
#根据规则2,第一个维度不匹配,因此扩展这个维度以匹配数组:a.shape ->(2,3), b.shape -> (2,3)
#现在两个数组的形状匹配了,可以看到它们的最终形状都为(2,3):
(2)示例2
来看两个数组均需要广播的示例:
#两个数组的形状为:a.shape=(3,1), b.shape=(3,)
#规则1告诉我们,需要用1将b的形状补全:a.shape -> (3,1), b.shape -> (1,3)
#规则2告诉我们,需要更新这两个数组的维度来相互匹配:a.shape -> (3,3), b.shape -> (3,3)
#因为结果匹配,所以这两个形状是兼容的