pandas库的数据类型运算

时间：2022-07-13 22:48:36

pandas库的数据类型运算

算数运算法则

根据行列索引,补齐运算(不同索引不运算,行列索引相同才运算),默认产生浮点数
补齐时默认填充NaN空值
二维和一维,一维和0维之间采用广播运算(低维元素与每一个高维元素运算)
采用 +-*/符号的二元运算会产生新的对象

a = pd.DataFrame(np.arange(12).reshape(3,4))

a

b = pd.DataFrame(np.arange(20).reshape(4,5))

b

# 维度相同,行列内元素个数不同的运算,自动补齐,缺项NaN

a + b

a * b

除了使用+-*/,也可使用方法形式,好处是可以增加可选参数

.add(d,**argws) 类型间加法运算,可选参数
.sub(d,**argws) 类型间减法运算,可选参数
.mul(d,**argws) 类型间乘法运算,可选参数
.div(d,**argws) 类型间除法运算,可选参数

b.add(a,fill_value = 100) #将a和b之间的缺失元素用100补齐并参加与运算

a.mul(b,fill_value = 0)

不同维度运算

b = pd.DataFrame(np.arange(20).reshape(4,5))

b

c = pd.Series(np.arange(4))

c

c - 10

b - c #b的每一行都与c运算一遍,二维和一维运算默认在轴1（行）发生

b.sub(c,axis=0) #指定用 列 参与运算

比较运算法则

比较运算只能比较相同索引的元素,不进行补齐(尺寸不同会报错)
二维和一维/一维和零维间为广播运算
采用>< >= <= -- !=等符号进行的二元运算产生布尔对象

a = pd.DataFrame(np.arange(12).reshape(3,4))

a

d = pd.DataFrame(np.arange(12,0,-1).reshape(3,4))

d

a > d #bool值表

a == d

b = pd.DataFrame(np.arange(12).reshape(3,4))

b

c = pd.Series(np.arange(4))

c

a > c

c > 0

相关文章

