面向交易的日内高频量化交易平台笔记

时间:2024-02-17 20:31:07
1. 本次讲座介绍。
长江证券金融工程部邀请了北京知象科技创始人,对其量化交易系统(股票、期货)进行了简单的介绍以及推广。
2.本次讲座主要设计的内容。
针对股票日内高频量化交易平台。本次讲座只cover沪深股票市场,因嘉宾认为期货高频比股票简单,而且期货高频目前的市场竞争非常惨烈,而股票日内高频算是蓝海。
3.国内高频数据定义。普通意义上即为L2快照数据,严格意义上只有深交所的逐笔委托、逐笔成交数据。国内一些做日内高频策略的私募只做深交所,不考虑上交所。
4.处理逐笔成交、逐笔委托的原因。
   一、真实的还原orderBook,以便确保回测尽可能接近市场
   二、获取挂单信息,如大的单买卖单,以便策略进行相应的实时处理
5.回测引擎(具体参见ppt)。尽可能的模拟交易所(集合竞价也做了考虑)。模拟、实盘,使用相同的接口以及数据结构。
6.处理逐笔成交、逐笔委托碰到的问题,如数据丢失。
7.嘉宾开发的平台考虑到平台程序处理效率,非策略部分,全部由C++编写。策略主要支持python、C ++。参照ppt,基于python策略的【回测性能】,性能非常高,如沪深全市场逐笔成交1天大概3200W条数据,获取时间大概10秒,回放时间大概720秒。
8.数据清洗,主办方对系统进行了大概半年的时间用人工方式,对历史数据进行了清洗。
9.会对数据质量进行打分,类似db事物处理的等级,越高、越慢。
10.机器学习、深度学习在量化交易领域的试用范围。
机器学习:提取特定数据集的模型。需要注意的是,输入的数据集要和期望获得模型相匹配。如要学习牛市的模型,输入的数据集需要是牛市范围的数据。
深度学习:处理日内高频数据