文件名称:IJCAI-18:IJCAI-18 阿里妈妈广告搜索转化率预测(round1 Rank 58)
文件大小:10.65MB
文件格式:ZIP
更新时间:2024-06-06 13:27:15
Python
IJCAI-18 阿里妈妈搜索广告转化率预测 队名:进复赛就开源 成绩:round1 Rank 58/5204,round2 112/5204 文件说明 main.py: 主函数,包括特征提取与函数定义。 EDA_visual.py: 数据可视化分析文件 Bayes code: 贝叶斯平滑代码,这个可进行预处理保存为文件,可节省时间。 数据分析 主要包括数据分布分析,训练数据与测试数据的区别,以及对数据去重,填补空缺值等操作。通过对数据可视化处理,分析出特征与转化率之间的关系,有利于后续对特征的提取。 主要特征 点击次数\个数统计特征: 原始特征主要包括用户信息,广告商品信息,上下文信息以及店铺信息。根据经验,首先对重要特征统计次数以及两两之间互相组合,主要包括:用户与商品组合,商品与商店组合,用户与商店组合以及它们之间内部的组合。这里主要用到的工具是pandas中的g
【文件预览】:
IJCAI-18-master
----model()
--------xgb1.model(458KB)
--------lgbm1.model(3.66MB)
----Bayes_smooth code()
--------userIDBayesSmooth.py(22KB)
--------shopIDBayesSmooth.py(22KB)
--------README.md(446B)
--------BrandIDBayesSmooth.py(23KB)
--------ItemIDBayesSmooth.py(22KB)
----main.py(53KB)
----README.md(5KB)
----EDA_visual.py(11KB)
----result()
--------result27.txt(20MB)
--------feature_score.txt(4KB)