处理数据要用到Pandas,但是没有学过,不知道是否有直接对某一列归一化的方法调用。自己倒弄了下。感觉还是比较麻烦。
使用Pandas读取到数组之后想把其中的‘MonthlyIncome’一列进行归一化,网上的栗子都是对整个dataframe进行归一化,因为我的数据有些列是类别,不能使用:
import pandas as pd import numpy as np #加载数据 #cvs df = pd.read_csv("train1.csv") #规格化 s = (df[\'MonthlyIncome\'] - df[\'MonthlyIncome\'].min())/(df[\'MonthlyIncome\'].max() - df[\'MonthlyIncome\'].min()) #安全删除,如果用del是永久删除 df2 = df.drop([\'MonthlyIncome\'],axis=1) #把规格化的那一列插入到数组中,最开始的14是我把他插到了第15lie df2.insert(14,\'MonthlyIncome\',s)
print(df2.columns[13:15])