文件名称:动态激励意识学习:情境拍卖中的稳健定价-研究论文
文件大小:966KB
文件格式:PDF
更新时间:2024-06-29 08:10:35
pricing robust learning
受广告交易市场定价的启发,我们考虑了在重复的上下文第二价格拍卖中对战略买家的底价进行稳健学习的问题。 买家对物品的估价取决于描述该物品的上下文。 然而,卖方并不了解上下文与买方估价之间的关系,即买方的偏好。 卖家的目标是通过观察过去的销售数据来设计一个学习策略来设定底价,她的目标是最小化她对收入的遗憾,其中遗憾是根据了解买家异质偏好的透视策略计算的。 给定卖方的目标,效用最大化的买方有动机不实投标以操纵卖方的学习策略。 我们提出了对这种战略行为稳健的学习政策。 这些政策使用拍卖的结果而不是提交的投标来估计偏好,同时控制每次拍卖的结果对未来底价的长期影响。 当卖方知道市场噪声分布时,我们提出了一种称为上下文稳健定价 (CORP) 的策略,该策略实现了 O(d log(Td)log(T)) 的 T 期后悔,其中 d 是上下文信息。 当卖方不知道市场噪声分布时,我们提出了两个策略,其遗憾在 T 中是次线性的。