文件名称:缺失预处理数据22222.csv
文件大小:18KB
文件格式:CSV
更新时间:2023-04-21 04:51:42
数据
缺失预处理数据22222.csv,用于学习缺失值处理的数据 impute.SimpleImputer 这个类是专门用来填补缺失值的。它包括四个重要参数 missing_values 告诉SimpleImputer,数据中的缺失值长什么样,默认空值np.nan strategy 我们填补缺失值的策略,默认均值。 输入“mean”使用均值填补(仅对数值型特征可用) 输入“median"用中值填补(仅对数值型特征可用) 输入"most_frequent”用众数填补(对数值型和字符型特征都可用) 输入“constant"表示请参考参数“fill_value"中的值(对数值型和字符型特征都可用) fill_value 当参数startegy为”constant"的时候可用,可输入字符串或数字表示要填充的值,常用0 copy 默认为True,将创建特征矩阵的副本,反之则会将缺失值填补到原本的特征矩阵中去。