IJCAI2018_rank_84:IJCAI2018 阿里妈妈广告转换率预测 复赛代码 最后线上得分0.14021 排名 845204

时间:2024-06-07 23:28:28
【文件属性】:

文件名称:IJCAI2018_rank_84:IJCAI2018 阿里妈妈广告转换率预测 复赛代码 最后线上得分0.14021 排名 845204

文件大小:8KB

文件格式:ZIP

更新时间:2024-06-07 23:28:28

Python

IJCAI2018_rank_84 IJCAI2018 阿里妈妈广告转换率预测 复赛代码 排名 84/5204 特征说明: 我的初赛方案: 1、缺失值填充: 如果缺少的条目很少,就用随机数填充,或者删掉。测试集的话就必须随机填充了。填充方法是,从未缺失的样本中采样,这样填充的话还能符合原来的样本分布。 如果缺失一定数目,那么就看情况是否能将其单独作为一类,例如本例中的性别缺失,可以理解为,不填性别的,可能用的也很少,转换率也很低,甚至是爬虫玩家。 2、最好将测试数据和训练数据拼起来预测。不过需要注意的是,涉及到统计数据时,要看是否要训练测试一起统计? 3、记得用lbl = preprocessing.LabelEncoder()对id类或者category类进行编码。 4、排序特征。其实也就是cumcount()。尤其是user-item的cum特征,React了很多问题。 5、统计3天前


【文件预览】:
IJCAI2018_rank_84-master
----data_process.py(8KB)
----utils.py(4KB)
----README.md(3KB)
----IJCAI2018_single_feature.ipynb(11KB)

网友评论