序列定位的深度强化学习-研究论文下载

【文件属性】：

文件名称：序列定位的深度强化学习-研究论文

文件大小：5.63MB

文件格式：PDF

更新时间：2024-06-29 10:39:16

Deep Reinforcement Learning

深度强化学习（DRL）为数字营销领域的变革开辟了许多前所未有的机遇。在这项研究中，我们设计了一种基于 DRL 的个性化定位策略。我们表明它可以解决该领域的四个重要挑战。 1) Sequential-decisions：考虑消费者的动态顺序行为； 2）前瞻性：平衡公司当前收入和未来收入； 3）边学习边学习：通过探索开发，在不断学习的同时实现利润最大化； 4）可扩展性：应对高维状态和策略空间。我们通过基于 DRL 的代理的新颖设计来说明上述内容。为了更好地使 DRL 适应复杂的消费者行为维度，我们提出了一种基于量化的不确定性学习启发式方法，用于有效的探索-利用。我们的策略评估结果表明，所提出的 DRL 代理比非 DRL 方法平均产生 26.75% 的长期收入，并且比所有基准中第二快的模型学习速度快 76.92%。此外，为了更好地了解潜在的基础机制，我们进行了多种可解释性分析来解释学习到的最优策略的模式。我们的发现提供了重要的管理相关和理论一致的见解。例如，开始时的连续降价促销可以抓住对价格敏感的消费者的即时注意力，而在降价促销之间精心间隔的非促销“冷却”期可以让消费者调整他们的参考点。此外，从长远来看，考虑未来的收入是必要的，但过多地衡量未来也会抑制收入。此外，最佳促销顺序因消费者参与阶段而异。总体而言，我们的结果表明 DRL 有潜力优化这些策略的组合以最大化长期收入。

立即下载

秒客网

序列定位的深度强化学习-研究论文

网友评论

相关文章