1 get_dummies函数
有多少种不同类就会产生多少位的编码,生成的age_df 实际上是一个变量,其存储着dataframe数据类型
完全可按dataframe对其操作
age_df = pd.get_dummies(user["age"], prefix="age") #prefix用于起列名,一般用原列名,也可自己定义
sex_df = pd.get_dummies(user["sex"], prefix="sex")
2 pickle模块
pickle.dump(user, open(dump_path, 'w')) #用于将user数据存入指定路径中,方便后续调用