math、numpy、pandas NaN 判断

时间:2023-03-08 18:16:08
>> np.nan == np.nan
False
>> np.nan is np.nan
True >> math.nan is np.nan
False
>> np.isnan(math.nan)
True

1. 判断 ndarray 中是否存在 nan

>> c = np.array([ 1.,  2., np.nan,  3.,  4.])
>> np.isnan(c)
array([False, False, True, False, False]) # 注意
>> np.nan != np.nan
True >> np.nan in c
False

上述方案要么返回的是一个序列,要么给出的是错误的结果。判断 numpy 下的多维数组中是否存在 nan 的简单方式:

>> np.isnan(np.min(c))
True
>> np.isnan(np.sum(c))
True # 因为
>> np.min(c)
nan
>> np.sum(c)
nan

2. 将 nan 填充为均值

>> c = np.array([ 1.,  2., np.nan,  3.,  4.])
>> c[np.isnan(c)] = np.mean(c[~np.nan(c)])