文件名称:识别高频交易策略中基于行为的学习-研究论文
文件大小:784KB
文件格式:PDF
更新时间:2024-06-09 01:03:20
Limit order book Inverse Reinforcement
电子市场已成为交易各种金融资产的热门场所,基于计算机的算法交易也已成为全球金融市场的主导力量。 识别和理解算法交易对金融市场的影响已成为市场运营商和监管机构的关键问题。 我们建议根据最有可能引起观察到的交易行为的奖励函数来描述交易者的行为。 我们的方法是将交易决策建模为马尔可夫决策过程(MDP),并使用最佳决策策略的观察结果来找到奖励函数。 这就是所谓的逆向强化学习(IRL)。 我们基于IRL的表征交易者行为的方法在两个理想的特征之间取得了平衡,因为它捕获了订单动态的关键经验属性,但在计算上仍然易于处理。 使用基于线性规划的IRL算法,在模拟的E-Mini S&P 500期货市场上进行的实验中,我们能够将高频交易与其他交易策略区分开来,从而达到90%以上的分类精度。 这些经验测试的结果表明,可以基于对单个交易行为的观察来准确地识别和分析高频交易策略。