学习具有定期预算的最佳在线广告组合-研究论文

时间:2024-06-29 13:54:58
【文件属性】:

文件名称:学习具有定期预算的最佳在线广告组合-研究论文

文件大小:1.26MB

文件格式:PDF

更新时间:2024-06-29 13:54:58

Online Advertising Online

在线广告使广告商能够通过个性化广告吸引客户。 广告商需要为他们的广告确定正确的目标,以及他们愿意为这些目标支付多少费用。 很大一部分在线广告使用实时拍卖定价,因此广告商需要决定在这些拍卖中竞标哪些目标。 我们与世界上最大的广告技术公司之一合作,开发了新算法,帮助广告商对目标组合进行最佳出价,同时考虑到在线广告固有的一些限制。 我们将此问题作为具有周期性预算的多臂强盗 (MAB) 问题来研究。 在每个时间段的开始,广告商需要确定选择哪个目标组合以最大化预期总收入(来自点击/转化的收入),同时将拍卖支付的总成本保持在广告预算内。 在本文中,我们制定了问题并开发了一种乐观稳健学习 (ORL) 算法,该算法使用来自上置信界 (UCB) 算法和稳健优化的思想。 我们证明了算法的预期累积后悔是有界的。 此外,对合成数据和真实世界数据的模拟表明,与基准相比,ORL 算法减少了至少 10-20% 的遗憾。


网友评论