高频走动何如下单?AI给出谜底→
紫竹山庄

紫竹山庄

让建站和SEO变得简单

让不懂建站的用户快速建站,让会建站的提高建站效率!

高频走动何如下单?AI给出谜底→

发布日期:2025-03-24 09:30    点击次数:176

  期货日报

  在金融商场的高频走动领域,收益率的可瞻望性一直是学术界和投资者关怀的焦点。高频收益率在不同商场环境下的可瞻望性对走动计策的制定和实行具有长远的影响。

  在本文中,咱们将简述Yacine Aït-Sahalia、Jianqing Fan等东说念主在其论文《How and When are High-Frequency Stock Returns Predictable?》中的主要发现,这些发现为高频收益率的可瞻望性提供了表面基础和实证依据。

  随后,咱们将先容咱们在国内期货商场的实证接洽经过,包括数据集先容、因子构造、瞻望意见设定及覆按圭表等。

  临了,咱们将分析国内实证的结束,主要包含模子的瞻望发扬以及瞻望区间和日内效支吾模子瞻望才智的影响。另外,咱们还探索了模子在本色下单计策中的应用,并通过模拟回测的款式比较了其与传统下单算法的性能相反。

  参考文件:

  论文《How and When are High-Frequency Stock Returns Predictable?》掌握机器学习圭表,深入接洽了超高频股票收益在不同维度下的可瞻望性和连接性。接洽发现,与中永恒收益率比较,高频收益率在短期内发扬出显赫、系统且多量的可瞻望性。

  具体来说,作家先从走动和报价数据中构建了一系列瞻望因子,并探讨了不同商场环境下股票可瞻望性变化的原因。跟着高频数据时效性提高,可瞻望性也会显赫增强,作家对这种变化进行了量化分析。临了,作家通过模拟推行,接洽了提前取得部分订单流标的(即使是不完满的信息)对瞻望才智的影响。这种前瞻性频繁由最快的高频走动者掌捏,豪迈显赫教育收益率的可瞻望性和连接性。

  国内实证

  1.数据集先容

  接洽品种:燃料油FU、螺纹钢RB。

  仅有计划流动性最好的主力合约。

  技能范围:2023/08/17—2023/11/16。

  2.因子构造

  在原文件中,作家基于限价订单簿及逐笔成交数据构建了13个因子。缺憾的是,国内期货商场的高频数据与海外的股票高频数据存在较大相反(逐笔成交数据缺失且数据频率存在相反),使得其中7个因子无法复现。为了进一步教育模子的瞻望才智,咱们运行了一项等闲的高频因子网罗和缔造职责。最终,咱们整理并缔造了跨越130个高频因子,并将其纳入华泰期货的高频因子库。对每个因子,咱们都会求其在10个回溯区间的均值行为后续机器学习模子的输入(特征),统统有1300+特征行为后续机器学习模子的输入。

  3.瞻望意见

  咱们的瞻望意见是将来10个Tick(5秒)的收益率,诡计款式为将来一段技能内的平均成交价钱与刻下中间价的比值减1:

  4.模子选拔

  在实证过程中,咱们主要使用了3种线性回想模子(OLS、Ridge、Lasso)以及3种机器学习回想模子(随即丛林、XGBoost、LightGBM)进行拟合。

  5.特征筛选

  为了提高瞻望精度和效力,咱们对每一个回想模子(除了OLS)都进行了特征的预筛选:

  第一步,先用小样本(前10天)的数据进行模子拟合(一皆特征行为输入)。

  第二步,关于LASSO模子,选拔回想系数未便是0的特征行为灵验特征;关于Ridge模子,选拔回想系数十足值排在前200的特征行为灵验特征;关于有蓄意树类模子,收用特征迫切性大于0的特征行为灵验特征。

  第三步,将灵验特征行为输入,在全样本上进行模子拟合和覆按。

  6.模子覆按

  咱们覆按模子的过程与原文件基本保持一致。覆按具体经过如下:

  1.学习阶段(Learning):关于每一组超参数和tT= T, T+5, T+10,...等技能点,使用从第T天到第T+4天(共5个走动日)的数据来覆按一个模子。在随后的5天区间[T+5,T+9]内评估这个模子,并为测试集中的每一天诡计样本外R²。

  2.调参阶段(Tuning):选拔最大平均R²值的超参数组合(诡计从T+5到T+19这段技能内扫数测试日R²值的平均值,共有15个测试日),并固定这组超参数用于下一步的瞻望。

  3.瞻望阶段(Predicting):关于每个T = T+20, T+21, ...等技能点,使用从第T-5天到第T-1天的数据来覆按一个模子,并使用该模子来瞻望第T天的结束。

  4.革新窗口(Rolling):将扫数这个词技能窗口上前革新20个走动日,即T变为T+20,然后叠加圭表1至4。

  国内实证结束

  瞻望发扬:由于原文件在实证结束枢纽中主要使用5秒行为日期时钟的瞻望区间,因此咱们也以瞻望区间5秒(10个Tick)为例,展示各模子在FU和RB上的瞻望结束。

  收益率瞻望:从40天测试集(Test set)的样本外R方上看,高频多因子模子在RB(螺纹钢)上的瞻望发扬优于FU(燃料油),最好模子的样本外R方分歧为20.74%及15.05%,均优于文件中的样本外R方中位数10%。该结束妥当预期,因为咱们特等引入了较多新的高频因子,使得模子更能捕捉到订单簿数据中的微不雅特征。

  标的瞻望:从40天测试集(Test set)的标的准确性上看,高频多因子模子在RB(螺纹钢)上的瞻望发扬不异略优于FU(燃料油),最好模子的标的准确性分歧为64.86%及62.97%,接近于文件中的样本外标的准确性64%。

  从模子层面上看,LASSO模子在这两个品种上都是发扬最好的模子。

  由于在参数模子中,LASSO模子发扬最好;在非参数模子中,LGBM模子举座发扬最好。因此,咱们后文进一步的实证分析仅针对LASSO模子和LGBM模子。

  2.瞻望区间

  文件提到,高频收益率在较短区间内的可瞻望性很强,但跟着区间的延迟而徐徐放松。咱们针对这一不雅点在国内实证枢纽作念了考据,得到了一致的论断:以品种RB,模子LASSO为例,跟着瞻望区间从10个Tick延迟到120个Tick,样本外R方从20.74%单调递减至4.94%,样本外标的准确性从64.86%单调递减到53.97%。

  3.日内效应

  咱们发现,每天清晨和下昼开盘时,模子的瞻望发扬显赫弱于其他时段。一个合理的阐扬是,开盘初期的走动响应了投资者关于隔夜(中午)新闻、公告及大家商场动态的抽象响应,这些信息的飞速涌入和消化过程中产生了较大的商场不对与波动,存在较多噪声,导致因子瞻望结束放松。

  本色应用(以下单算法为例)

  在本末节中,咱们专注于该模子鄙人单层面的本色应用。

  1.模拟测试

  模拟布景:当今,咱们假定有一投资者需要在短技能内下200手买单。针对这一需求,咱们通过回测的款式对比不同算法下的下单老本。

  参数设定:测试的参数有两个,分歧是下单的总技能,以及拆单的次数。咱们测算了下单总技能在1分钟、5分钟、10分钟,以及拆单次数在10次、20次、30次下的下单老本。

  2.下单算法

  TWAP:技能圮绝固定,将走动订单在一段技能内均匀分派。

  VWAP:技能圮绝固定,但字据前5天同期段的成交量,加权分派单次的下单量

  ModelPrice:基于高频因子模子的下单算法,最初均匀拆分订单量及技能段,在每个技能段中,当模子瞻望将来5秒收益率大于0时才下单,不然恭候,若是在技能段结束时仍未触发开仓条款则强制开仓。

  3.模拟结束

  从最优概率上看,基于高频因子的下单算法在样本外的模拟中有神圣75%的概率是三者中最优的算法。从平均滑点上看,基于高频因子的下单算法的平均滑点显赫优于TWAP算法和VWAP算法,平均约有0.15跳的优化。

新浪投合大平台期货开户 安全快捷有保险 海量资讯、精确解读,尽在新浪财经APP

拖累剪辑:张靖笛



栏目分类

紫竹山庄

期货日报 在金融商场的高频走动领域,收益率的可瞻望性一直是学术界和投资者关怀的焦点。高频收益率在不同商场环境下的可瞻望性对走动计策的制定和实行具有长远的影响。 在本文中,咱们将简述Yacine Aït-Sahalia、Jianqing Fan等东说念主在其论文《How and When are High-Frequency Stock Returns Predictable?》中的主要发现,这些发现为高频收益率的可瞻望性提供了表面基础和实证依据。 随后,咱们将先容咱们在国内期货商场的实证接洽经