使用强化学习估计支付系统中的策略函数-研究论文

时间:2024-06-29 11:16:34
【文件属性】:

文件名称:使用强化学习估计支付系统中的策略函数-研究论文

文件大小:1.47MB

文件格式:PDF

更新时间:2024-06-29 11:16:34

Artificial intelligence Reinforcement

本文使用强化学习 (RL) 来近似参与高价值支付系统的银行的政策规则。 代理的目标是学习在一天开始时选择提供给系统的流动性数量的策略函数。 个别选择具有复杂的战略影响,排除了最优策略的封闭形式解决方案,除非在简单的情况下。 我们表明,在简化的双智能体设置中,使用强化学习的智能体确实学习了最小化处理其个人付款的成本的最佳策略。 我们还表明,在更复杂的环境中,两个代理都学会了降低流动性成本。 我们的结果显示了 RL 在现实世界战略游戏中估计最佳响应函数的适用性。


网友评论