文件名称:在线广告平台冷启动:数据驱动算法和现场实验-研究论文
文件大小:5.14MB
文件格式:PDF
更新时间:2024-06-29 10:55:13
Cold Start Problem
冷启动描述了在线广告平台中普遍公认的挑战:由于数据有限,机器学习系统无法准确估计新广告的点击率 (CTR) 和转化率 (CVR),进而无法对这些新广告进行有效定价或与平台用户匹配。 新广告冷启动不成功会促使广告主离开平台,降低广告市场的厚度。 为了解决在线广告平台的冷启动问题,我们构建了一个数据驱动的优化模型,以捕捉短期收入和广告的长期市场厚度之间的基本权衡。 基于对偶理论和*算法,我们开发了带有可证明后悔上限的 O(T^{2/3}K^{1/3}(logT)^{1/3) 的影子竞价学习 (SBL) 算法}d^{1/2}),其中 K 是广告数量,d 是底层机器学习预言机用于预测 CTR 和 CVR 的有效维度。 此外,我们提出的算法可以在实践中直接实现,对真实的在线广告系统进行最少的调整。 为了证明我们的冷启动算法的实用性,我们与一个大型在线视频共享平台合作,在线实现了该算法。 在这种情况下,传统的单边实验会导致估计有很大偏差。 因此,我们进行了一项新的双边随机现场实验,并设计了无偏估计来检查 SBL 算法的有效性。 我们的实验结果表明,所提出的算法可以使冷启动成功率大幅提高 61.62%,而短期收益仅降低 0.717%,从而使总目标值提高 0.147%。 我们的研究弥合了强盗算法理论与广告冷启动实践之间的差距,并突出了精心设计的冷启动算法对在线广告平台的重要价值。