文件名称:动态定价和学习:高斯过程回归的应用-研究论文
文件大小:683KB
文件格式:PDF
更新时间:2024-06-29 12:26:44
dynamic pricing revenue
我们考虑在需求未知且必须通过价格实验学习时提供最优价格的问题 - 多臂*问题的变体。 在每个时期,零售商必须决定一个价格,同时使用已经获得的知识来权衡探索其他价格与最大化收入的好处。 针对此类问题提出的其他算法要么分别学习每个价格的价格-需求关系,要么确定假设的参数需求函数的参数。 相反,我们将高斯过程回归与 Thompson 抽样相结合,作为一种非参数学习算法,可以学习价格和需求之间的任何函数关系。 与现有方法相比,这种 GP-TS 算法在价格向量数量方面的扩展性要好得多,但它对价格-需求关系的函数形式没有限制性假设。 我们展示了如何将算法应用于考虑单个和多个产品的有限库存设置以及外生上下文信息可以影响价格的设置。 该算法的一个优点是其性能不取决于所有产品的价格向量数量,而仅取决于考虑的产品数量。 对于这里考虑的每个设置,我们对现有算法的方法进行基准测试。 GP-TS算法的学习性能远远优于同行,尤其是在同时学习的产品数量增加的情况下。 最后,我们提出了扩展,当需求遵循伯努利或泊松分布时,可以应用我们的算法。