【Python学习】sklearn.preprocessing.LabelBinarizer()

时间:2022-06-07 15:50:26

在多数的机器学习比赛中,给出的标签都是非数字化的,所以我们需要对其进行转换。代码如下:

from sklearn import preprocessing
feature = [[0,1], [1,1], [0,0], [1,0]]
label= ['yes', 'no', 'yes', 'no']
lb = preprocessing.LabelBinarizer() #构建一个转换对象
Y = lb.fit_transform(label)
re_label = lb.inverse_transform(Y)
print(Y)
print(re_label)

输出

[[1] [0] [1] [0]]
['yes' 'no' 'yes' 'no']

转换函数将字符串label进行数字化,数字范围从0开始,并且将label转换为了一个列向量。最后在ML任务完成之后,输出的时候需要还原之前的label,因此使用函数inverse_transform()