序列定位的深度强化学习-研究论文

时间:2024-06-29 10:39:16
【文件属性】:

文件名称:序列定位的深度强化学习-研究论文

文件大小:5.63MB

文件格式:PDF

更新时间:2024-06-29 10:39:16

Deep Reinforcement Learning

深度强化学习(DRL)为数字营销领域的变革开辟了许多前所未有的机遇。 在这项研究中,我们设计了一种基于 DRL 的个性化定位策略。 我们表明它可以解决该领域的四个重要挑战。 1) Sequential-decisions:考虑消费者的动态顺序行为; 2)前瞻性:平衡公司当前收入和未来收入; 3)边学习边学习:通过探索开发,在不断学习的同时实现利润最大化; 4)可扩展性:应对高维状态和策略空间。 我们通过基于 DRL 的代理的新颖设计来说明上述内容。 为了更好地使 DRL 适应复杂的消费者行为维度,我们提出了一种基于量化的不确定性学习启发式方法,用于有效的探索-利用。 我们的策略评估结果表明,所提出的 DRL 代理比非 DRL 方法平均产生 26.75% 的长期收入,并且比所有基准中第二快的模型学习速度快 76.92%。此外,为了更好地了解潜在的基础机制,我们进行了多种可解释性分析来解释学习到的最优策略的模式。 我们的发现提供了重要的管理相关和理论一致的见解。 例如,开始时的连续降价促销可以抓住对价格敏感的消费者的即时注意力,而在降价促销之间精心间隔的非促销“冷却”期可以让消费者调整他们的参考点。 此外,从长远来看,考虑未来的收入是必要的,但过多地衡量未来也会抑制收入。 此外,最佳促销顺序因消费者参与阶段而异。 总体而言,我们的结果表明 DRL 有潜力优化这些策略的组合以最大化长期收入。


网友评论