文件名称:通过政策梯度学习理性预期:经济分析-研究论文
文件大小:3.38MB
文件格式:PDF
更新时间:2024-06-30 06:11:59
Rational expectations; Game Theory;
本文基于计算机科学的方法进行边际分析并细化自适应学习模型(例如,Erev & Roth 1998)的更新规则。 我们提出政策梯度强化学习(PGRL)来模拟去中心化市场经济的平衡过程,其中效用最大化者仅使用收到的收益来协调行动以实现理性预期。 对于每个学习经验,适应性规则不仅通过学习的边际收益来强化选择的行动,而且通过其边际机会成本调整每个先前的选择。 因此,玩家在早期探索中表现出寻求风险的行为,但由于学习的边际效用递减而在后期表现出风险厌恶。 通过生成多样化和复杂动态的呼叫市场模拟来证明改进规则的有效性。