“海量”专题(148)——高频因子在不同周期和域下的表现及影响因素分析

论坛 期权论坛 期权     
海通量化团队   2019-11-21 20:13   6671   0
重要提示:《证券期货投资者适当性管理办法》于2017年7月1日起正式实施,通过本微信订阅号发布的观点和信息仅供海通证券的专业投资者参考,完整的投资观点应以海通证券研究所发布的完整报告为准。若您并非海通证券客户中的专业投资者,为控制投资风险,请取消订阅、接收或使用本订阅号中的任何信息。本订阅号难以设置访问权限,若给您造成不便,敬请谅解。我司不会因为关注、收到或阅读本订阅号推送内容而视相关人员为客户;市场有风险,投资需谨慎。
在前期报告中,我们从交易逻辑出发,使用分钟、tick以及逐笔数据构建了一系列高频因子,在2019年5月发布周报样本外跟踪以来,取得了优异稳定的表现。
在本篇报告中,我们将考察高频因子在不同周期和域下的表现,以及分析影响因子表现的因素。
[h1]1高频因子计算方法[/h1][h1]1.1因子定义[/h1]



[h1]1.2回测参数设置[/h1]回测区间:2010.01-2019.10;
样本空间:剔除ST、停牌、涨跌停、上市不满6个月、距退市不足1个月的股票;
成交价:次日开盘后半小时VWAP;
交易成本:双边千分之三。
我们在下文中将依次考察原始因子和正交因子的表现,其中正交因子是通过横截面回归剔除行业、市值、非线性市值、反转、换手、特异度、流动性、估值、盈利、成长等因子后得到。
[h1]2月频调仓下的因子表现[/h1][h1]2.1全市场选股[/h1]月频调仓下,各个因子在全市场中选股表现如以下图表所示。绝大多数因子月均多空收益差在1.5%以上,rank IC均值在7%以上,其中成交委托相关性因子收益最高。
在剔除了行业、市值等常规因子影响之后,多数因子选股效果明显下降,其中尾盘成交占比因子由于和市值具有负相关性,正交之后选股效果明显提升,因子月均多空收益差从0.97%提升至1.47%,rank IC均值从1.92%提升至4.30%。
我们分别考察因子多头和空头的超额收益,可以发现,多数因子空头贡献更大,其中平均单笔流出金额占比因子多头收益最高,月均超额0.64%。









[h1]2.2沪深300中选股[/h1]将选股空间限定为沪深300成分股以后,因子选股能力普遍下降,其中尾盘成交占比因子表现较好,月均多空收益差和rank IC均值分别为0.97%和3.98%。两个成交委托相关性因子多头表现较好,月均超额收益均在0.5%以上。




[h1]2.3中证500中选股[/h1]高频因子在中证500成分股中的表现介于全市场和沪深300成分股之间。尾盘成交占比因子同样表现出色,月均多空收益差和rank IC均值分别为1.29%和3.92%。





[h1]2.4因子表现对比[/h1]不同选股空间和评价指标下表现最好的因子如下表所示。



[h1]3周频调仓下的因子表现[/h1][h1]3.1全市场选股[/h1]周频调仓下,各个因子在全市场中选股表现如以下图表所示。绝大多数因子周均多空收益差在0.5%以上,rank IC均值在5%以上,其中改进反转因子收益最高,周均多空收益差和rank IC均值分别为1.10%和7.76%。
在剔除了行业、市值等常规因子影响之后,多数因子选股效果明显下降,尾盘成交占比因子正交之后选股效果有所提升,但相对月频调仓,提升幅度较小。
我们分别考察因子多头和空头的超额收益,可以发现,多数因子空头贡献更大,其中平均单笔流出金额占比因子多头收益仍然最高,周均超额0.29%。








[h1]3.2沪深300中选股[/h1]将选股空间限定为沪深300成分股以后,因子选股能力普遍下降,其中量价相关性和改进反转因子表现较好,rank IC均值分别为5.53%和4.73%。多头周均超额收益均为0.17%。




[h1]3.3中证500中选股[/h1]高频因子在中证500成分股中的表现介于全市场和沪深300成分股之间, 量价相关性和改进反转因子同样表现较好,rank IC均值分别为5.82%和5.75%。




[h1]3.4因子表现对比[/h1]不同选股空间和评价指标下表现最好的因子如下表所示。



[h1]4复合高频因子[/h1][h1]4.1因子相关性[/h1]我们下面考察高频因子相关性,图17展示的是截面因子值相关系数均值及因子rank IC时间序列的相关系数。可以发现,同一级别、同一类别因子之间相关性较高,例如收益分布类因子中的高频偏度与下行波动占比因子值的相关系数和rank IC的相关系数分别为-0.89和0.90。但不同级别、不同类别因子之间相关性较低,例如使用分钟数据计算生成的尾盘成交占比和使用tick数据计算生成的成交委托相关性因子值的相关系数和rank IC的相关系数分别为-0.06和-0.10。


[h1]4.2复合因子表现[/h1]我们首先对和常规因子正交后的9个高频因子做进一步对称正交,再按过去12个月因子IC均值加权,构建复合因子。
复合因子在不同周期和域下的表现如以下图表所示。月频调仓下,因子rank IC均值和rank ICIR分别为6.85%和6.13,胜率高达96%。周频调仓下,因子表现进一步提升,rank IC均值和rank ICIR分别为8.48%和10.86。








[h1]5高频因子影响因素分析[/h1]在专题报告《选股因子系列研究(五十二) ——基于决策树的因子择时模型》中,我们构建了决策树模型来划分市场环境,并分析因子在不同市场环境下的表现。在本篇报告中, 我们将沿用决策树模型, 探讨高频因子的影响因素。
[h1]5.1模型与择时变量[/h1]本文选取了指数收益率、波动率、换手率等14个基础择时指标(指标代码后缀_raw),以及滞后一期(指标代码后缀_lag1)、24期滚动时间序列标准化(指标代码后缀_zscore)、24期滚动时间序列标准化+滞后一期处理后(指标代码后缀_zscore_lag1)的42个衍生指标,总共56个指标作为择时变量,具体如表14所示。分析因子在不同域中的表现时,我们使用相应指数以及成分股来计算指标,例如全样本选股则计算wind全A指数的相关指标,沪深300指数内选股则计算沪深300指数的相关指标。
我们分别选取正交后的因子多空收益、多头超额收益、rank IC、回归溢价beta作为被解释变量,总共构建了216棵回归树,对应不同因子、周期、域下的不同因子收益类型。


决策树又可进一步分为分类树与回归树,本文后续构建的模型主要基于回归树,在训练回归树时使用CART算法。对于回归树模型,最大深度(Max Depth)、节点最小样本量(Min sample leaf)以及分叉最小样本量(Min sample split)都是模型的超参数。在进行模型超参数选择时,使用时间序列交叉验证的方式确定相关超参数。
[h1]5.2单因子回归树[/h1]我们在本节中将以高频偏度和成交委托相关性为例展示单因子回归树, 回归结果如图22-25所示。
高频偏度的影响因子主要为指数月最大涨幅与表现最差的10%的个股的平均收益。当指数月最大涨幅低于一定阈值,表现最差的10%的个股涨幅低于一定阈值时,因子表现最好,该情景下共有46个样本,对应因子rank IC均值为4.4%。
成交委托相关性的影响因子主要为个股月收益率截面标准差和个股月收益率均值。当个股月收益率截面标准差极高时,因子月均多空收益差高达6.8%,但仅有3个样本。当个股月收益率截面标准差低于阈值时,个股月收益率均值具有明显的区分效果,均值较低的样本中因子多空收益更高。
由此可见,高频偏度和成交委托相关性因子都是在市场整体表现不佳的环境下能够获得更高的收益,这和我们在前文得到的结论一致,即高频因子选空头能力更强。






[h1]5.3整体表现[/h1]高频因子在不同周期、域、因子收益类型下的回归树R方如表15-16所示,月频调仓下的R方分布在20%-30%区域内,周频调仓下的R方分布在10%-20%区域内,模型解释能力普遍较低。
各回归树的特征重要性均值如图26-27所示,月频和周频下最重要的特征分别为跌幅最大的10%个股月均收益,以及涨幅最大与涨幅最小的10%个股的月均收益差。
由此可见,由于高频因子稳定性较强,因子收益难以被外生变量解释, 且多数高频因子选空头能力强,故表现最差的个股的收益对因子收益影响相对较大。






[h1]6总结与展望[/h1]我们在本篇报告中考察了高频因子在不同周期和域下的表现,并分析了影响因子表现的因素,得到以下结论与思考。
月频调仓下,在全市场中,成交委托相关性因子表现较好;正交后,改进反转和尾盘成交占比因子表现较好。沪深300成分股中,成交委托相关性因子表现较好;中证500成分股中,改进反转和大单推动涨幅因子表现较好。平均单笔流出金额占比因子多头超额收益较高。周频调仓下,绝大多数因子的选股能力有所增强。高频因子复合后稳定性进一步提升,月频模型rank IC均值和rank ICIR分别为6.82%和6.15;周频模型的rank IC均值和rank ICIR分别为8.48%和10.86。
由于高频因子具有高信息比率和高胜率的特征,基于外生变量构建的回归树模型R方普遍较低。影响较大的择时变量主要是市场中表现最差的一部分股票的跌幅, 这是因为高频因子选空头能力更为突出。
高频因子收益难以被外生变量解释,因此我们建议投资者将高频因子作为alpha因子加入到多因子组合中,以提升组合的信息比和胜率, 降低组合的回撤,感兴趣的投资者可以参考报告《近期指数增强策略回撤原因分析》。关于如何解决因子空头问题,可以采取加权IC打分、因子反向剔除、长短周期组合叠加等思路,我们将在后续报告中作进一步研究。
本文介绍的高频因子均基于交易逻辑,未来将尝试自动挖掘高频因子, 并动态调整因子库。我们在日频数据上已经做了一些尝试,感兴趣的投资者可以参考报告《量化选股因子的批量生产与集中管理》。
[h1]6风险提示[/h1]因子失效风险,流动性风险。联系人:姚石,(021)23219443
专题报告下载地址:
https://pan.baidu.com/s/16uVSstHyllcLB5nEiL4bGA



“海量”专题回顾
【点击标题可链接至报告原文】
【海通金工量化策略回顾】
48、“海量”专题(48)——海通金工2017年量化策略回顾
104、“海量”专题(104)——行稳致远:海通金工2018量化策略回顾


【宏观量化与资产配置】
7、“海量”专题(7)——大类资产配置之风险预算模型
20、“海量”专题(20)——长期投资者如何进行战略资产配置
23、“海量”专题(23)——中国版全天候策略
27、“海量”专题(27)——2017,全球对冲基金的新纪元?
33、“海量”专题(33)——Black-Litterman模型的直观理解
36、“海量”专题(36)——积极的风险均衡(Active Risk Parity)策略
46、“海量”专题(46)——Faber的战术资产配置策略在中国市场上的应用
56、“海量”专题(56)——从周期调整市盈率(CAPE)看中美股市当前的估值水平
59、“海量”专题(59)——宏观动量策略在全球股票市场中的应用
66、“海量”专题(66)——宏观动量策略在债券市场中的应用
67、“海量”专题(67)——宏观预期数据的选择与应用
101、“海量”专题(101)——美股的均值回归特征和收益率预测
105、“海量”专题(105)——全球股市轮动策略兼论从全球视角看A股投资价值
112、“海量”专题(112)——MOM投资框架
117、“海量”专题(117)——美国MOM数据分析
119、“海量”专题(119)——负债驱动投资(LDI)简介
124、“海量”专题(124)——主权财富基金资产配置的共性与差异
139、“海量”专题(139)——行业的长期价值与CAPE的应用


【因子投资与Smart Beta】
9、“海量”专题(9)——高相关资产配置中的因子维与组合优化
10、“海量”专题(10)——高相关资产配置中的因子预算
14、“海量”专题(14)——大类资产中的风格因子与Smart Beta
41、“海量”专题(41)——风险加权指数
118、“海量”专题(118)——“单因子多组合”还是“多因子单组合”
122、“海量”专题(122)——反向剔除的因子组合
133、“海量”专题(133)——个股加权方式对比


【行业轮动】
16、“海量”专题(16)——动量策略及收益率高阶矩在行业轮动下的应用
49、“海量”专题(49)——行业一致预期数据的应用分析
52、“海量”专题(52)——“基本面+价格”选出好行业
65、“海量”专题(65)——龙头股效应在行业轮动上的应用
68、“海量”专题(68)——行业间动量和趋势因子的应用分析
70、“海量”专题(70)——预期情绪数据在行业轮动中的应用
72、“海量”专题(72)——宏观经济数据应用于行业轮动的探索
73、“海量”专题(73)——周期、非周期板块内的行业轮动

102、“海量”专题(102)——基于行业Alpha收益的行业轮动模型

103、“海量”专题(103)——行业微观因子的轮动效果
126、“海量”专题(126)——基于BL模型的行业配置策略
136、“海量”专题(136)——基金行业配置观点的分析


【因子择时与风格轮动】
4、“海量”专题(4)——多因子择时初探
19、“海量”专题(19)——基于条件期望的因子择时框架
47、“海量”专题(47)——探寻风格轮动的先行指标
57、“海量“专题(57)——大小盘轮动研究(创业板50 vs 上证50)
75、“海量”专题(75)——指数轮动:沪深300 VS 中证500
90、“海量”专题(90)——宏观数据在板块轮动中的应用
95、“海量”专题(95)——因子失效预警:因子拥挤

108、“海量”专题(108)——因子拥挤度的改进

109、“海量”专题(109)——因子拥挤度的扩展
134、“海量”专题(134)——基于回归树的因子择时模型


【量化多因子选股】
1、“海量”专题(1)——市值因子的非线性特征
2、“海量”专题(2)——选股因子的正交
3、“海量”专题(3)——从最大化复合因子单期IC角度看因子权重
11、“海量”专题(11)——业绩反转之绝对收益

13、“海量”专题(13)——因子视角下的事件驱动策略
15、“海量”专题(15)——因子视角下的事件驱动策略收益
17、“海量”专题(17)——高频因子之收益分布特征
21、“海量”专题(21)——分析师主要要素变动共振事件
22、“海量”专题(22)——价值投资系列之便宜是否值得买
24、“海量”专题(24)——分析师一致预期相关因子
26、“海量”专题(26)——关注盈利是短期风格还是长期趋势
29、“海量”专题(29)——历史财务信息对股票收益的预测能力
30、“海量”专题(30)——历史盈利在预测股票收益时的作用
34、“海量”专题(34)——高频因子之已实现波动率分解
35、“海量”专题(35)——因子加权、正交和择时的若干性质
37、“海量”专题(37)——分位数回归在多因子选股中的应用
38、“海量”专题(38)——因子降维1:底层因子降维方法对比
39、“海量”专题(39)——分析师荐股是否存在超额收益
40、“海量”专题(40)——一致预期数据的质量分析
43、“海量”专题(43)——学术研究中的财务异象之盈利能力
44、“海量”专题(44)——学术研究中的财务异象之盈利质量
51、“海量”专题(51)——A股因子的适用环境分析

55、“海量”专题(55)——学术研究中的财务异象之应计量的分解
58、“海量”专题(58)——业绩超预期股票收益特征分析
60、“海量”专题(60)——哪种分析师推荐报告最值得关注?
63、“海量”专题(63)——A股市场存在龙头股效应吗?
64、“海量”专题(64)——龙头股效应在一致预期数据上的应用
71、“海量”专题(71)——被机构调研的上市公司有超额收益吗?
76、“海量”专题(76)——宏观经济数据可以用来选股吗
77、“海量”专题(77)——宏观经济的不确定性在A股市场被定价了吗?
79、“海量”专题(79)——解禁、融资融券、陆股通和质押的超额收益机会分析

80、“海量”专题(80)——分析师覆盖度与股票预期收益
82、“海量”专题(82)——原油价格对行业和股票影响的量化分析
84、“海量”专题(84)——哪些宏观经济指标可以选股?

85、“海量”专题(85)——A股是否存在异质动量现象?
89、“海量”专题(89)——哪些事件驱动策略可以因子化?
91、“海量”专题(91)——如何计算盈利指标的趋势?
91、“海量”专题(92)——因子敞口上限对优化组合的影响
93、“海量”专题(93)——放松组合构建中的行业中性约束
94、“海量”专题(94)——高频量价因子在股票与期货中的表现
96、“海量”专题(96)——医药行业因子选股研究

97、“海量”专题(97)——预期因子的底层数据处理
100、“海量”专题(100)——行业、概念板块的动量溢出效应
111、“海量”专题(111)——质量因子
113、“海量”专题(113)——近期指数增强策略回撤原因分析
115、“海量”专题(115)——预期调整类因子的收益特征
121、“海量”专题(121)——日内分时成交中的玄机
123、“海量”专题(123)——捕捉投资者的交易意愿
125、“海量”专题(125)——探索A股的五因子模型
127、“海量”专题(127)——当下跌遇到托底
128、“海量”专题(128)——股票的“共性”与“个性”
132、“海量”专题(132)——消费板块的因子组合
137、“海量”专题(137)——上市公司关系网因子
140、“海量”专题(140)——资产增长稳定性与资本结构变化
142、“海量”专题(142)——价量波动幅度
146、“海量”专题(146)——买卖单数据中的Alpha


【衍生品和CTA策略】
5、“海量”专题(5)——CTA策略介绍及配置价值(上)
6、“海量”专题(6)——CTA策略介绍及配置价值(下)
8、“海量”专题(8)——豆粕/白糖商品期权指南

12、“海量”专题(12)——基于动量和期限结构的商品期货策略
18、“海量"专题(18)——多品种期货策略中的权重分配
31、“海量"专题(31)——商品期货因子挖掘与组合构建再探究(上)
32、“海量"专题(32)——商品期货因子挖掘与组合构建再探究(下)
42、“海量”专题(42)——CTA多品种趋势策略中的仓位管理方法
53、“海量专题”(53)——基于海内外期货持仓报告的CTA策略
61、“海量”专题(61)——原油期货指南
83、“海量”专题(83)——2年期国债期货指南
87、“海量”专题(87)——揭开“逆周期因子”的神秘面纱
110、“海量”专题(110)——2018 年期货市场及CTA策略回顾
135、“海量”专题(135)——CTA因子适用性分析及品种动态筛选策略
147、“海量”专题(147)——沪深300期权介绍与展望


【FOF与基金研究】
25、“海量”专题(25)——债券基金的风格归因与因子剥离初探
28、“海量”专题(28)——债券基金风格归因模型2.0之七因子剥离体系

45、“海量”专题(45)——因子剥离体系下的债券基金久期估测构想
69、“海量”专题(69)——A股市场的基金经理是否具备择时能力?
78、“海量”专题(78)——基金业绩持续性的影响因素分析
81、“海量”专题(81)——FoF投资中,如何对主动权益基金进行因子剥离
98、“海量”专题(98)——基金风格稳定性评估及功能性权益基金挖掘
106、“海量”专题(106)——利用因子暴露监控公募基金仓位和投资风格的变化
114、“海量”专题(114)——国内公募权益类基金有Alpha吗?
129、“海量”专题(129)——Alpha是来自于运气还是实力?
130、“海量”专题(130)——基金业绩归因方法论综述
138、“海量”专题(138)——债券型基金的工具化分类探究

141、“海量”专题(141)——如何评估债基的股债配置能力

143、“海量”专题(143)——偏股类公募基金的隐含基准探究
144、“海量”专题(144)——基金经理的偏好圈与能力圈


【创新产品研究】
50、“海量”专题(50)——新理念、新趋势:ESG投资概述
62、“海量”专题(62)——目标日期基金的下滑轨道设计
120、“海量”专题(120)——ESG评级在因子组合构建中的应用


【高频交易策略】
131、“海量”专题(131)——基于集合竞价分时走势的A股T+0策略


【基本面量化】
145、“海量”专题(145)——基本面量化与另类数据应用的实践


【量化市场观察】
54、“海量”专题(54)——亏损这么多,我该拿你怎么办?
74、“海量”专题(74)——战略配售基金投资标的基本面及收益率分析
86、“海量”专题(86)——股市极值及收益率预测模型的周度择时研究
88、“海量”专题(88)——中国企业的税收负担及其对上市公司投资价值的影响
99、“海量”专题(99)——行业收益结构变化带来的机遇
107、“海量”专题(107)——中美股票市场指数的季节效应

法律声明:
本公众订阅号(微信号:海通量化团队)为海通证券研究所金融工程运营的唯一官方订阅号,本订阅号所载内容仅供海通证券的专业投资者参考使用,仅供在新媒体背景下的研究观点交流;普通个人投资者由于缺乏对研究观点或报告的解读能力,使用订阅号相关信息或造成投资损失,请务必取消订阅本订阅号,海通证券不会因任何接收人收到本订阅号内容而视其为客户。
本订阅号不是海通研究报告的发布平台,客户仍需以海通研究所通过研究报告发布平台正式发布的完整报告为准。
市场有风险,投资需谨慎。在任何情况下,本订阅号所载信息或所表述的意见并不构成对任何人的投资建议,对任何因直接或间接使用本订阅号刊载的信息和内容或者据此进行投资所造成的一切后果或损失,海通证券不承担任何法律责任。
本订阅号所载的资料、意见及推测有可能因发布日后的各种因素变化而不再准确或失效,海通证券不承担更新不准确或过时的资料、意见及推测的义务,在对相关信息进行更新时亦不会另行通知。
本订阅号的版权归海通证券研究所拥有,任何订阅人如欲引用或转载本订阅号所载内容,务必联络海通证券研究所并获得许可,并必注明出处为海通证券研究所,且不得对内容进行有悖原意的引用和删改。
海通证券研究所金融工程对本订阅号(微信号:海通量化团队)保留一切法律权利。其它机构或个人在微信平台以海通证券研究所金融工程名义注册的、或含有“海通证券研究所金融工程团队或小组”及相关信息的其它订阅号均不是海通证券研究所金融工程官方订阅号。



分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:595
帖子:119
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP