文件名称:基于高斯过程的交易策略识别-研究论文
文件大小:1.11MB
文件格式:PDF
更新时间:2024-06-09 02:59:36
Inverse Reinforcement Learning Gaussian Process
电子金融市场和相关技术的出现极大地改善了市场参与者在速度,容量和复杂性方面可以使用的交易功能。 来自市场运营商的高级数据输入和审计跟踪信息也使对市场参与者行为的全面观察成为可能。 这项研究的主要目的是在逆向强化学习(IRL)框架下使用贝叶斯推理对算法交易行为进行建模。 我们将交易者行为建模为奖励空间中的高斯过程。 通过对不同市场参与者的不完整观察,我们旨在恢复最优政策和相应的奖励函数,以解释不同情况下的交易者行为。 我们表明,使用乔和贝林(2011)开发的高斯过程逆强化学习(GPIRL)算法可以准确识别算法交易行为,并且该算法优于线性特征最大化方法。 使用基于支持向量机(SVM)的分类方法,使用GPIRL模型进行的实际市场数据实验始终能提供超过95%的交易者识别精度。 我们还表明,Kirilenko等人(2011)提出的现有的基于统计的摘要交易者分类与基于行为的分类之间存在明显的联系。 为了解决交易行为随时间的潜在变化,我们提出了一种基于得分的分类方法,以解决不同市场条件下算法交易行为的变化。 我们进一步认为,由于基于行为的识别比基于汇总统计的方法更好地反映了在不同市场条件下交易者的行为和价值主张,因此,与基于汇总统计的方法相比,它更具信息性和可靠性。非常适合发现市场参与者的新行为模式。