文件名称:kddcup_2015:备忘录kddcup_2015
文件大小:7.22MB
文件格式:ZIP
更新时间:2024-06-10 15:11:59
HTML
KDDCUP 2015总结 参赛队伍:最终有821支队伍 半测试数据排名:最终排名第71位,AUC = 0.88926 过程 特征制作->模型制作->(合奏) 从原始数据创建功能是在C ++中完成的,其余的都是在R中完成的。 问题 使用中国的 (XuetangX)访问日志来预测用户是否会退出。 退出的定义:如果自访问日志聚合期间的结束日期起10天内未保留访问日志。 基本上,将从访问日志中创建一个功能(培训:大约120,000,测试:大约80,000实例,没有给出测试标签) 火车数据访问日志(测试也采用这种格式) enrollment_id,time,source,event,object 1,2014-06-14T09:38:29,server,navigate,Oj6eQgzrdqBMlaCtaq1IkY6zruSrb71b <- ここから 1,2014-06-14T09:38: