实际项目中有这样的需求,将某一列的值,映射成类别型的数据,这个时候,需要我们将范围等频切分,或者等距切分。
具体的做法可以先看某一些特征的具体分布情况,然后我们选择合适的阈值进行分割。
1
2
3
4
5
6
7
8
9
10
11
|
def age_map(x):
if x < 26 :
return 0
elif x > = 26 and x < = 35 :
return 1
elif x > 35 and x < = 45 :
return 2
return 3
else :
return 4
|
也就是用pandas自带的函数来表示:
1
|
pd.isnull(x)
|
最后我们可以应用map函数:
1
|
data[ 'age' ] = data[ 'birth_year' ]. map (age_map)
|
以上这篇对pandas数据判断是否为NaN值的方法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/tongjinrui/article/details/82848158