one-hot编码

时间:2022-10-17 00:33:25

1 get_dummies函数

有多少种不同类就会产生多少位的编码,生成的age_df 实际上是一个变量,其存储着dataframe数据类型

完全可按dataframe对其操作

 age_df = pd.get_dummies(user["age"], prefix="age") #prefix用于起列名,一般用原列名,也可自己定义
 sex_df = pd.get_dummies(user["sex"], prefix="sex")

2  pickle模块

pickle.dump(user, open(dump_path, 'w'))  #用于将user数据存入指定路径中,方便后续调用

参考:https://www.cnblogs.com/fmgao-technology/p/9078918.html