【原创】数据处理中判断空值的方法(np.isnan、is np.nan和pd.isna)比较

时间:2022-05-15 21:24:08
 

1、np.isnan(只有数组数值运算时可使用)
注意:numpy模块的isnan方法仅支持对数值进行判断,因此传入的如果是字符串类型会报错
 
2、is np.nan(不建议使用)
如果我们的空值只会出现由numpy模块的nan,或只想判断由numpy模块生成的nan值,可以使用,但其他场合一律不建议使用
注意:因为math模块同样可以产生nan值,且math.nan由is np.nan判断是False,例如下面代码
 
 1 a = math.nan
 2 b = np.nan
 3  
 4 a is b
 5 Out[19]: False
 6  
 7 np.isnan(a)
 8 Out[20]: True
 9 np.isnan(b)
10 Out[21]: True
11  
12 a is np.nan
13 Out[22]: False
14 b is np.nan
15 Out[23]: True

 

3、pd.isna(大部分数据处理的场合推荐使用)
如果我们的空值既会出现np.nan,也会出现math.nan,甚至还会出现None,或者要判断的数据值既可能是数值型也可能是字符串(符合大部分场景的实际情况),墙裂推荐使用pd.isna,例如下面代码
 
 1 pd.isna(np.nan)
 2 Out[29]: True
 3 pd.isna(math.nan)
 4 Out[30]: True
 5 pd.isna(None)
 6 Out[31]: True
 7 pd.isna('a')
 8 Out[32]: False
 9 pd.isna(10)
10 Out[33]: False