IJCAI-18alimama:IJCAI-18 阿里妈妈搜索广告转化预测大赛,top50方案

时间:2024-06-07 16:15:11
【文件属性】:

文件名称:IJCAI-18alimama:IJCAI-18 阿里妈妈搜索广告转化预测大赛,top50方案

文件大小:633.29MB

文件格式:ZIP

更新时间:2024-06-07 16:15:11

Python

IJCAI-18 阿里妈妈搜索广告大赛 赛题介绍 给定广告点击相关的用户(user)、广告商品(ad)、检索词(query)、上下文内容(context)、商店(shop)等信息的条件下预测广告产生购买行为的概率(pCVR)。其中初赛预测的是普通日期的广告转化率,复赛预测的是特殊日期的广告转化率。 详细信息: 最终成绩:复赛48名 赛题分析 本赛题的正负样本比例极度不均衡,但是因为采用的是logloss评价函数,不适合抽样更改训练数据集的正负样本比,同样的有些模型的参数(比如xgb的scale_pos_weight)也是不宜用的,这些在模型的官方文档上也有说明。 单一用户的记录太少,很多用户在整个数据集中都只有一条记录,因此用户维度的特征比较难挖掘,相反商品维度的特征会更有帮助一些。 初赛与复赛由于预测的日期属性不同,造成数据分布上很大的变化。原本初赛的特征方法和模型构建方法仅仅是对复赛有


【文件预览】:
IJCAI-18alimama-master
----README.md(9KB)
----lr()
--------lr2B_hashour.txt(49.92MB)
--------lr2B_oof_train.csv(41.34MB)
--------lr2A(14482).txt(19.97MB)
--------lr2B(14143).txt(46.51MB)
--------lr2A_hashour.txt(21.37MB)
--------lr2B.pkl(547KB)
--------lr2A.pkl(505KB)
--------lr2_adjust_result.py(3KB)
--------lr2A_oof_train.csv(41.33MB)
--------lr2A_oof_test.csv(19.89MB)
--------lr2.py(33KB)
--------lr2B_oof_test.csv(46.47MB)
----ensemble()
--------blending2B(14002).txt(46.56MB)
--------blending2B(13961).txt(46.59MB)
--------blending2.py(2KB)
----fea_factory2.py(49KB)
----keng()
--------fusai_b_xgb_5_12_adjust.txt(46.58MB)
--------fusai_b_xgb_5_14_normal_adjust.txt(46.59MB)
--------fusai_b_xgb_5_15_adjust.txt(46.58MB)
----fm()
--------fm2.py(38KB)
----ffm()
--------ffm2.py(44KB)
--------ffm1A(8271).txt(592KB)
--------ffm1.py(33KB)
--------libffm()
--------ffm1A(8192).txt(693KB)
--------ffm1A_oof_train.csv(15.06MB)
--------ffm1A_oof_test.csv(628KB)
----lake()
--------lgb2B_with_normal_hashour_after_lake_5_15_9_all.txt(41.45MB)
----data()
--------put_dataset_here(0B)
----xgb1()
--------xgboost1B.model(552KB)
--------xgboost1A_oof_test(8168).txt(729KB)
--------xgboost2B_oof_test.csv(46.47MB)
--------xgboost1A(8119).txt(729KB)
--------xgboost2B_hashour.txt(49.93MB)
--------xgboost1A(8157).txt(729KB)
--------xgboost2B(14054).txt(46.53MB)
--------xgboost2B.txt(46.6MB)
--------xgboost2B(merge13975).txt(46.59MB)
--------xgboost1B(8495).txt(1.66MB)
--------xgboost2A(14711).txt(19.92MB)
--------xgboost2A(14517).txt(20MB)
--------xgboost1A(8137).txt(729KB)
--------xgboost2B_add_normal_oof_test.csv(46.48MB)
--------xgboost1A.model(366KB)
--------xgboost2B_oof_train.csv(41.37MB)
--------xgboost2B(14054)_adjust_mean.txt(46.58MB)
--------xgboost1A-1(8157).txt(729KB)
--------xgboost1A(8149).txt(729KB)
--------xgboost1B_oof_test.csv(1.66MB)
--------xgboost2B_15normal.txt(46.61MB)
--------xgboost2B_add_normal(merge13975).txt(41.44MB)
--------xgboost2B.model(642KB)
--------xgboost1A(8107).txt(729KB)
--------xgboost1B_oof_train.csv(15.51MB)
--------xgboost2A.model(740KB)
--------xgboost1A(8168).txt(729KB)
--------xgboost2_adjust_result.py(3KB)
--------xgboost2A_post_pro(14514).txt(17.79MB)
--------xgboost2B_add_normal.model(880KB)
--------xgboost1B(8488).txt(1.66MB)
--------xgboost1A(8108).txt(729KB)
--------xgboost1.py(53KB)
--------xgboost2A_oof_test.csv(19.92MB)
--------xgboost2A(14449).txt(19.98MB)
--------xgboost2A_hashour.txt(21.41MB)
--------xgboost2B_add_normal_oof_train.csv(64.02MB)
--------xgboost2A_oof_train.csv(41.33MB)
--------xgboost2A(14376).txt(19.98MB)
--------xgboost2B_add_normal_hashour.txt(49.94MB)
--------xgboost2.py(21KB)
--------xgboost1A_oof_test.csv(729KB)
--------xgboost1A_oof_train.csv(15.48MB)
--------xgboost2A(1442).txt(19.98MB)

网友评论