如下所示:
1
2
3
4
5
6
7
8
9
10
11
12
13
|
#简单来说 LabelEncoder 是对不连续的数字或者文本进行编号
from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
le.fit([ 1 , 5 , 67 , 100 ])
le.transform([ 1 , 1 , 100 , 67 , 5 ])
输出: array([ 0 , 0 , 3 , 2 , 1 ])
#OneHotEncoder 用于将表示分类的数据扩维:
from sklearn.preprocessing import OneHotEncoder
ohe = OneHotEncoder()
ohe.fit([[ 1 ],[ 2 ],[ 3 ],[ 4 ]])
ohe.transform([ 2 ],[ 3 ],[ 1 ],[ 4 ]).toarray()
输出:[ [ 0 , 1 , 0 , 0 ] , [ 0 , 0 , 1 , 0 ] , [ 1 , 0 , 0 , 0 ] ,[ 0 , 0 , 0 , 1 ] ]
|
以上这篇对python 数据处理中的LabelEncoder 和 OneHotEncoder详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/u012560212/article/details/53405338