文件名称:使用机器学习技术预测高频股票价格-研究论文
文件大小:1.13MB
文件格式:PDF
更新时间:2024-06-29 22:09:23
Machine Learning Time
本文解决了基于机器学习方法使用高频数据预测股票价格的问题。 我们在本文中研究了两件事(1)在寻找最佳样本内经验损失最小化器的过程中,根据所提出的评估措施,比较具有给定回溯参数的所选函数类之间的预测性能(2)比较在获得从交易和报价 (TAQ) 数据中提取的一组引入的高频数据特征后,通过更改金融时间序列数据的采样频率来分析这些结果。 对于 TAQ 数据的分析,特征工程涉及 56 个相关特征的计算,包括市场微观结构、统计和技术指标特征。 进行重新估计以提高数据模型的预测精度,以获得每个移动窗口的预测值。 另一方面,算法模型的使用无需重新估计实际问题,因为训练模型所花费的时间通常大于数据的采样频率。 此外,还引入了回溯参数来切断不相关的很久以前的历史数据。 在实验中选择的函数类中,结果表明 PCA 回归在给定采样频率(即 3 分钟、5 分钟等)的 NASDAQ100 指数和 TAQ 数据的平均方向准确度和简单回溯测试方面表现最好. 与之前使用 NASDAQ100 的研究相比,结果表明重新估计和正确选择的回溯参数提高了建议评估措施的预测性能。 当谈到最大回撤时,这是一个对风险管理至关重要的衡量标准,DA-RNN 呈现了最小值,因此是所有时间频率的 TAQ 数据表现最好的模型。 我们还提供了 DM 统计数据,其零假设是任何两个给定模型的预测值的准确性不会不同。 对于所有采样频率的 TAQ 数据,有证据表明在比较 PCA 回归和 DA-RNN 模型时我们不能拒绝原假设。 大量实验提供了使用高频时间序列数据正确评估最佳样本内经验损失最小化器的预测性能的见解。