延迟接受博弈中的更好回复动态-研究论文

时间:2024-06-30 01:30:49
【文件属性】:

文件名称:延迟接受博弈中的更好回复动态-研究论文

文件大小:429KB

文件格式:PDF

更新时间:2024-06-30 01:30:49

better-reply dynamics deferred

在本文中,我们解决了利用延迟接受算法的双边匹配机制中的学习问题。 我们考虑一个重复的匹配游戏,在这个游戏中,代理在每个时期观察他们的匹配并有机会修改他们的策略(即他们将提交给机制的偏好列表)。 我们在本文中关注更好的回复动态。 为此,我们首先提供了更好回复的特征以及对策略之间优势关系的全面描述。 Better-reply 结构简单,可以分解为四种类型的变化。 然后,我们针对短视和有限理性代理提出了一个简单的更好回复动态,并确定了确保限制结果与代理发挥其主导策略时获得的结果等效的条件。 Better-reply 动态可能不会收敛,但如果它们确实收敛,则限制策略配置文件构成阶段博弈的纳什均衡的子集。


网友评论