文件名称:移动促销平台的渐近紧学习算法-研究论文
文件大小:348KB
文件格式:PDF
更新时间:2024-06-08 14:56:51
online advertising learning regret minimization
移动促销平台可在供需双方不确定的情况下运行,可为单个广告商开展广告活动。 活动随时间动态到达,分为多个季节; 每个广告活动都需要平台在期望的时间间隔内从期望的一组位置传递目标数量的移动展示。 该平台通过从发布商那里获得印象来实现这些活动,发布者通过对广告交易平台进行实时出价来为应用程序提供广告空间。 每个位置均以其获胜曲线为特征,即出价金额与在该出价下赢得印象的概率之间的关系。 平台最初并不知道各个感兴趣位置的获胜曲线,并且它根据赢得印象的出价和已实现的结果即时了解它们。 每个获得的印象都分配给一个正在进行的活动。 该平台的目标是在感兴趣的时间范围内将其总成本(购买印象所花费的金额以及由于广告系列的目标未达到而导致的罚款)最小化。 我们的主要结果是针对此问题的招标和分配政策。 我们使用一种策略下的后悔概念表明该策略是该问题的最佳解决方案(渐近严格),即该策略下的预期总成本与千里眼问题的最优成本之间的差(即该平台会提前提供有关所有位置的获胜曲线的完整信息):任何政策下的遗憾都是Ω(√I),其中I是赛季数,而我们政策下的遗憾是O(√I)。