文件名称:Pur_Red_forecast:大数据竞赛——资金流入流出预测
文件大小:13KB
文件格式:ZIP
更新时间:2024-06-12 12:16:24
Python
天猫大数据竞赛——资金流入流出预测 竞赛过程中挖掘到的信息及决赛注意事项 模型选择 ARIMA (HW)+ LM 预测整月的数据 对一些特征点进行调优 (中秋,调休,国庆前) 决赛相对之前的升级: 模型方面主要是增加了数据预处理 和 线性模型中的特征; 特殊时间点方面,主要是更好的刻画了月初、月末的特征. 关于评测 如果评测机会比较充足,了解一下自己的purchase得分和redeem得分对后续方向的指导意义比较大,purchase由于比较稳定,所以得分应该更高;而redeem会因为波动比较大,预测难一些; 不要迷信用八月份的数据做线下评测得到的效果,八月份数据略坑,及早从坑里爬出来.一般来说; 评估函数不是线性的,越准确上分速度越快,加入一些小幅的噪声有可能能够提高成绩; 基本流程 需要对整体数据做一个处理,比如数据预处理、分解、汇总,这个正好使用ODPS,语法同HIVE,可以查HIVE
【文件预览】:
Pur_Red_forecast-master
----PRF8.py(3KB)
----PRF7.py(910B)
----PRF5.r(1KB)
----PRF4.py(609B)
----PRF2.py(601B)
----README.md(13KB)
----example code for ODPS.R(1KB)
----PRF3.py(4KB)
----PRF1.py(641B)
----example code for ODPS.sql(3KB)
----create_table.sql(372B)
----PRF6.py(1001B)