文件名称:task03-特征工程.md
文件大小:20KB
文件格式:MD
更新时间:2023-04-18 09:47:35
特征工程
特征工程主要进行以下一些操作: 1.导入数据 2.删除异常值:截断过大或过小值的数据 3.特征构造: - 广告发布时间:将年、月、日信息单列出来 - 汽车使用时间=广告时间-注册时间 - 城市信息=邮政编码后三位 - 销售统计量:比如价格的最大最小值、中位数、均值、方差等 4.数据分桶:对功率等数值型变量分桶 5.特征筛选:通过相关系数找出对结果影响较大的变量