“海量”专题(146)——买卖单数据中的Alpha

论坛 期权论坛 期权     
海通量化团队   2019-11-8 16:44   7844   0
重要提示:《证券期货投资者适当性管理办法》于2017年7月1日起正式实施,通过本微信订阅号发布的观点和信息仅供海通证券的专业投资者参考,完整的投资观点应以海通证券研究所发布的完整报告为准。若您并非海通证券客户中的专业投资者,为控制投资风险,请取消订阅、接收或使用本订阅号中的任何信息。本订阅号难以设置访问权限,若给您造成不便,敬请谅解。我司不会因为关注、收到或阅读本订阅号推送内容而视相关人员为客户;市场有风险,投资需谨慎。
[h1]0引言[/h1]在《选股因子系列研究(四十六)——日内分时成交中的玄机》、《选股因子系列研究(四十七)——捕捉投资者的交易意愿》、《选股因子系列研究(四十九)——当下跌遇到托底》等报告中,我们讨论了分钟级以及TICK级因子的构建,本文更进一步,尝试基于逐笔数据构建因子。不同于系列专题报告《选股因子系列研究(十一)——Level2行情选股因子初探》中的因子构建方法,本文基于逐笔数据的叫买序号以及叫卖序号,将逐笔成交数据合成为买卖单数据,并基于买卖单数据构建了相关选股因子刻画股票日内交易结构。
[h1]1从“笔”数据到“单”数据[/h1]在逐笔数据中,投资者往往比较关注BS标志,并常常围绕该字段构建因子。然而,在逐笔数据的相关字段中,除了BS标志值得关注外,叫卖序号以及叫买序号同样值得关注。下表展示了某股票在2019年7月1日的部分逐笔成交数据。


由于一个买单或者卖单会因对手盘的挂单结构而被切分为多笔成交,因此在刻画投资者行为时,可将逐笔成交数据还原为买卖单数据,并从买卖单的角度进行分析。
以上表展示的数据为例,前4笔成交的叫买序号皆为1153445,而叫卖序号则各不相同,因此可知某投资者在下买单时的量为2200股,而对应的4个卖单的量分别为1500股、100股、100股以及500股。相比于将4笔成交数据分别进行分析,将4笔成交数据还原成对应的买单以及卖单更具有逻辑性。由于无法基于数据字段直接区分投资者,买卖单数据更适于进行投资者行为的刻画。本文后续讨论的所有因子皆是基于买卖单数据计算得到的。更多处理细节可联系报告作者。

[h1]2大单成交金额占比类因子[/h1]由于股票成交中的大买单以及大卖单广受投资者关注,我们可基于买卖单数据尝试构建大单成交金额占比因子。本文在识别大单时,并未考虑使用绝对阈值。本文使用了“N倍标准差”的方式,在每个交易日对于每个股票单独设定大单筛选阈值。在筛选得到大单数据后,可按照以下方式计算因子:


本章基于以上指标首先构建了月度因子。月度因子值为各指标前20交易日的均值。本文在后文中同样会讨论因子在不同调仓频率下的表现。下表展示了各大单成交金额占比因子在正交前后的截面选股能力。由于在筛选大单时需要设定参数N,本章分别展示了N=1以及N=3时因子的选股能力。需要说明的是,下表以及后文中的正交因子为剔除了行业、市值、中盘、换手、反转、波动、估值、盈利以及盈利成长后的因子。


观察上表不难发现,大单成交金额占比类因子在从原始因子的角度看并未呈现出明显的截面选股能力。其主要原因是,因子与市值正相关,市值较大的股票更容易呈现大单占比较高的特征。在剔除常规因子的影响后,大买成交金额占比、大买大卖成交金额占比差值皆呈现出了显著的正向选股能力。也即,在控制了常规因素的影响后,大买成交金额占比越高或者大买成交金额占比越高于大卖成交金额占比,股票未来的超额收益表现越好。此外,通过对比不同参数下因子的表现可知,过于严格的大单删选标准会减弱因子的选股能力。随着筛选标准的提升,各股票间的区分度会越来越弱。下图展示了正交后大单成交金额占比类因子的多空相对强弱净值走势。自2014年以来,大买成交金额占比因子具有较好的收益表现。在1倍标准差筛选法下,因子多空年化收益达22.7%,月度胜率达84%。


[h1]3买卖单集中度[/h1]大单成交金额占比类因子从大单的角度刻画了股票日内的交易结构,然而由于该因子选股能力在一定程度上受到大单筛选方法的影响,因此本章尝试从交易集中度的角度刻画股票在日内的交易结构。基于各股票的买卖单数据,可计算以下因子:


本章基于以上指标首先构建了月度因子,各股票的月度因子值为前20日指标值的均值。下表展示了各集中度因子在正交前后的截面选股能力。


从原始因子的角度看,除买卖集中度差值外,其余因子皆呈现出了较为显著的选股能力。股票的集中度越高,未来的超额收益表现越好。值得注意的是,买单集中度因子与卖单集中度因子的IC方向相同,并未呈现出“买单集中度具有看多能力,卖单集中度具有看空能力”的现象。
在正交剔除了常规因子的影响后,集中度因子依旧呈现出了较为明显的截面选股能力。除买卖集中度差值外,其余因子皆与股票未来收益正相关。也即,在控制了常规因素的影响后,股票集中度越高,未来的超额收益表现越好。下图进一步展示了正交前后各集中度因子的多空相对强弱净值走势。自2014年以来,买单集中因子与卖单集中度因子多空年化收益高于30%。在正交后,两因子多空年化收益分别为13%以及16%,月度胜率达70%。


[h1]4不同指数范围内的选股能力[/h1]回测结果表明,大单成交金额占比类因子在不同的选股范围中都具有较为稳定的选股能力。即使在沪深300指数中,因子依旧对于股票收益具有较好的预测效果。不同于大单占比类因子,集中度因子的选股能力主要集中于中小市值的股票中,该因子在进入中证800指数后基本未呈现出显著的选股能力。更多细节可参考报告原文。






正交后的大单成交金额占比类因子在沪深300指数中依旧呈现出了较为显著的截面选股能力。在1倍标准差筛选法下,大买成交金额占比因子的月均IC为0.04,月度胜率达75%,因子月度多空收益为1.28%。集中度因子在该范围内的选股能力较弱。
[h1]5不同换仓频率下的选股能力[/h1]由于本文所讨论的因子是基于高频数据计算得到,因此因子可应用于不同调仓频率下的选股模型。本章展示了相关因子在2周、1周、2天以及1天调仓频率下的选股能力。需要注意的是,因子值计算窗口会随着调仓频率的变化而改变。例如,2周调仓的频率下,因子值的计算窗口为前2周,而在1周调仓的频率下,因子值的计算窗口为前1周。
下表展示了不同调仓频率下因子的IC均值。可以看到,月度有效的因子在更高的换仓频率下依旧具有选股能力。

除了IC外,因子的ICIR会随着换仓频率的提升而逐步提升。也即,换仓频率越高,因子表现越稳定。下表展示了不同调仓频率下因子的年化ICIR。


[h1]6总结[/h1]本文主要基于逐笔数据合成了买卖单数据,并基于买卖单数据构建了相关因子刻画股票日内交易结构。因子整体回测结果具有一定的逻辑性,前期大单买入金额占比较高的股票,未来表现更好。股票日内买卖单成交分布越不均匀,大单特征越明显,股票未来表现越好。
本文同样在不同的选股范围以及不同的选股频率下对于因子的收益表现进行了回测分析。回测结果表明,大买成交金额占比因子在不同的选股范围内皆具有收益区分能力,而集中度因子的选股能力主要集中在中小盘的股票中。此外,随着调仓频率的提升,月度上有效的因子依旧具有截面选股能力,且因子选股能力的稳定性会越来越强。
本文仅初步挖掘了逐笔数据合成得到的买卖单成交量所包含的信息,我们将在后续的报告中对于成交价所包含的信息进行讨论。
[h1]7风险提示[/h1]市场系统性风险、资产流动性风险以及政策变动风险会对策略表现产生较大影响。联系人:袁林青,(021)23212230
专题报告下载地址:
https://pan.baidu.com/s/16uVSstHyllcLB5nEiL4bGA



“海量”专题回顾
【点击标题可链接至报告原文】
【海通金工量化策略回顾】
48、“海量”专题(48)——海通金工2017年量化策略回顾
104、“海量”专题(104)——行稳致远:海通金工2018量化策略回顾


【宏观量化与资产配置】
7、“海量”专题(7)——大类资产配置之风险预算模型
20、“海量”专题(20)——长期投资者如何进行战略资产配置
23、“海量”专题(23)——中国版全天候策略
27、“海量”专题(27)——2017,全球对冲基金的新纪元?
33、“海量”专题(33)——Black-Litterman模型的直观理解
36、“海量”专题(36)——积极的风险均衡(Active Risk Parity)策略
46、“海量”专题(46)——Faber的战术资产配置策略在中国市场上的应用
56、“海量”专题(56)——从周期调整市盈率(CAPE)看中美股市当前的估值水平
59、“海量”专题(59)——宏观动量策略在全球股票市场中的应用
66、“海量”专题(66)——宏观动量策略在债券市场中的应用
67、“海量”专题(67)——宏观预期数据的选择与应用
101、“海量”专题(101)——美股的均值回归特征和收益率预测
105、“海量”专题(105)——全球股市轮动策略兼论从全球视角看A股投资价值
112、“海量”专题(112)——MOM投资框架
117、“海量”专题(117)——美国MOM数据分析
119、“海量”专题(119)——负债驱动投资(LDI)简介
124、“海量”专题(124)——主权财富基金资产配置的共性与差异
139、“海量”专题(139)——行业的长期价值与CAPE的应用


【因子投资与Smart Beta】
9、“海量”专题(9)——高相关资产配置中的因子维与组合优化
10、“海量”专题(10)——高相关资产配置中的因子预算
14、“海量”专题(14)——大类资产中的风格因子与Smart Beta
41、“海量”专题(41)——风险加权指数
118、“海量”专题(118)——“单因子多组合”还是“多因子单组合”
122、“海量”专题(122)——反向剔除的因子组合
133、“海量”专题(133)——个股加权方式对比


【行业轮动】
16、“海量”专题(16)——动量策略及收益率高阶矩在行业轮动下的应用
49、“海量”专题(49)——行业一致预期数据的应用分析
52、“海量”专题(52)——“基本面+价格”选出好行业
65、“海量”专题(65)——龙头股效应在行业轮动上的应用
68、“海量”专题(68)——行业间动量和趋势因子的应用分析
70、“海量”专题(70)——预期情绪数据在行业轮动中的应用
72、“海量”专题(72)——宏观经济数据应用于行业轮动的探索
73、“海量”专题(73)——周期、非周期板块内的行业轮动

102、“海量”专题(102)——基于行业Alpha收益的行业轮动模型

103、“海量”专题(103)——行业微观因子的轮动效果
126、“海量”专题(126)——基于BL模型的行业配置策略
136、“海量”专题(136)——基金行业配置观点的分析


【因子择时与风格轮动】
4、“海量”专题(4)——多因子择时初探
19、“海量”专题(19)——基于条件期望的因子择时框架
47、“海量”专题(47)——探寻风格轮动的先行指标
57、“海量“专题(57)——大小盘轮动研究(创业板50 vs 上证50)
75、“海量”专题(75)——指数轮动:沪深300 VS 中证500
90、“海量”专题(90)——宏观数据在板块轮动中的应用
95、“海量”专题(95)——因子失效预警:因子拥挤

108、“海量”专题(108)——因子拥挤度的改进

109、“海量”专题(109)——因子拥挤度的扩展
134、“海量”专题(134)——基于回归树的因子择时模型


【量化多因子选股】
1、“海量”专题(1)——市值因子的非线性特征
2、“海量”专题(2)——选股因子的正交
3、“海量”专题(3)——从最大化复合因子单期IC角度看因子权重
11、“海量”专题(11)——业绩反转之绝对收益

13、“海量”专题(13)——因子视角下的事件驱动策略
15、“海量”专题(15)——因子视角下的事件驱动策略收益
17、“海量”专题(17)——高频因子之收益分布特征
21、“海量”专题(21)——分析师主要要素变动共振事件
22、“海量”专题(22)——价值投资系列之便宜是否值得买
24、“海量”专题(24)——分析师一致预期相关因子
26、“海量”专题(26)——关注盈利是短期风格还是长期趋势
29、“海量”专题(29)——历史财务信息对股票收益的预测能力
30、“海量”专题(30)——历史盈利在预测股票收益时的作用
34、“海量”专题(34)——高频因子之已实现波动率分解
35、“海量”专题(35)——因子加权、正交和择时的若干性质
37、“海量”专题(37)——分位数回归在多因子选股中的应用
38、“海量”专题(38)——因子降维1:底层因子降维方法对比
39、“海量”专题(39)——分析师荐股是否存在超额收益
40、“海量”专题(40)——一致预期数据的质量分析
43、“海量”专题(43)——学术研究中的财务异象之盈利能力
44、“海量”专题(44)——学术研究中的财务异象之盈利质量
51、“海量”专题(51)——A股因子的适用环境分析

55、“海量”专题(55)——学术研究中的财务异象之应计量的分解
58、“海量”专题(58)——业绩超预期股票收益特征分析
60、“海量”专题(60)——哪种分析师推荐报告最值得关注?
63、“海量”专题(63)——A股市场存在龙头股效应吗?
64、“海量”专题(64)——龙头股效应在一致预期数据上的应用
71、“海量”专题(71)——被机构调研的上市公司有超额收益吗?
76、“海量”专题(76)——宏观经济数据可以用来选股吗
77、“海量”专题(77)——宏观经济的不确定性在A股市场被定价了吗?
79、“海量”专题(79)——解禁、融资融券、陆股通和质押的超额收益机会分析

80、“海量”专题(80)——分析师覆盖度与股票预期收益
82、“海量”专题(82)——原油价格对行业和股票影响的量化分析
84、“海量”专题(84)——哪些宏观经济指标可以选股?

85、“海量”专题(85)——A股是否存在异质动量现象?
89、“海量”专题(89)——哪些事件驱动策略可以因子化?
91、“海量”专题(91)——如何计算盈利指标的趋势?
91、“海量”专题(92)——因子敞口上限对优化组合的影响
93、“海量”专题(93)——放松组合构建中的行业中性约束
94、“海量”专题(94)——高频量价因子在股票与期货中的表现
96、“海量”专题(96)——医药行业因子选股研究

97、“海量”专题(97)——预期因子的底层数据处理
100、“海量”专题(100)——行业、概念板块的动量溢出效应
111、“海量”专题(111)——质量因子
113、“海量”专题(113)——近期指数增强策略回撤原因分析
115、“海量”专题(115)——预期调整类因子的收益特征
121、“海量”专题(121)——日内分时成交中的玄机
123、“海量”专题(123)——捕捉投资者的交易意愿
125、“海量”专题(125)——探索A股的五因子模型
127、“海量”专题(127)——当下跌遇到托底
128、“海量”专题(128)——股票的“共性”与“个性”
132、“海量”专题(132)——消费板块的因子组合
137、“海量”专题(137)——上市公司关系网因子
140、“海量”专题(140)——资产增长稳定性与资本结构变化
142、“海量”专题(142)——价量波动幅度


【衍生品和CTA策略】
5、“海量”专题(5)——CTA策略介绍及配置价值(上)
6、“海量”专题(6)——CTA策略介绍及配置价值(下)
8、“海量”专题(8)——豆粕/白糖商品期权指南

12、“海量”专题(12)——基于动量和期限结构的商品期货策略
18、“海量"专题(18)——多品种期货策略中的权重分配
31、“海量"专题(31)——商品期货因子挖掘与组合构建再探究(上)
32、“海量"专题(32)——商品期货因子挖掘与组合构建再探究(下)
42、“海量”专题(42)——CTA多品种趋势策略中的仓位管理方法
53、“海量专题”(53)——基于海内外期货持仓报告的CTA策略
61、海量“专题(61)——原油期货指南
83、“海量”专题(83)——2年期国债期货指南
87、“海量”专题(87)——揭开“逆周期因子”的神秘面纱
110、“海量”专题(110)——2018 年期货市场及CTA策略回顾
135、“海量”专题(135)——CTA因子适用性分析及品种动态筛选策略


【FOF与基金研究】
25、“海量”专题(25)——债券基金的风格归因与因子剥离初探
28、“海量”专题(28)——债券基金风格归因模型2.0之七因子剥离体系

45、“海量”专题(45)——因子剥离体系下的债券基金久期估测构想
69、“海量”专题(69)——A股市场的基金经理是否具备择时能力?
78、“海量”专题(78)——基金业绩持续性的影响因素分析
81、“海量”专题(81)——FoF投资中,如何对主动权益基金进行因子剥离
98、“海量“专题(98)——基金风格稳定性评估及功能性权益基金挖掘
106、“海量”专题(106)——利用因子暴露监控公募基金仓位和投资风格的变化
114、“海量”专题(114)——国内公募权益类基金有Alpha吗?
129、“海量”专题(129)——Alpha是来自于运气还是实力?
130、“海量”专题(130)——基金业绩归因方法论综述
138、“海量”专题(138)——债券型基金的工具化分类探究

141、“海量”专题(141)——如何评估债基的股债配置能力

143、“海量”专题(143)——偏股类公募基金的隐含基准探究
144、“海量”专题(144)——基金经理的偏好圈与能力圈


【创新产品研究】
50、“海量”专题(50)——新理念、新趋势:ESG投资概述
62、“海量”专题(62)——目标日期基金的下滑轨道设计
120、“海量”专题(120)——ESG评级在因子组合构建中的应用


【高频交易策略】
131、“海量”专题(131)——基于集合竞价分时走势的A股T+0策略


【基本面量化】
145、“海量”专题(145)——基本面量化与另类数据应用的实践


【量化市场观察】
54、“海量”专题(54)——亏损这么多,我该拿你怎么办?
74、“海量”专题(74)——战略配售基金投资标的基本面及收益率分析
86、“海量”专题(86)——股市极值及收益率预测模型的周度择时研究
88、“海量”专题(88)——中国企业的税收负担及其对上市公司投资价值的影响
99、“海量”专题(99)——行业收益结构变化带来的机遇
107、“海量”专题(107)——中美股票市场指数的季节效应

法律声明:
本公众订阅号(微信号:海通量化团队)为海通证券研究所金融工程运营的唯一官方订阅号,本订阅号所载内容仅供海通证券的专业投资者参考使用,仅供在新媒体背景下的研究观点交流;普通个人投资者由于缺乏对研究观点或报告的解读能力,使用订阅号相关信息或造成投资损失,请务必取消订阅本订阅号,海通证券不会因任何接收人收到本订阅号内容而视其为客户。
本订阅号不是海通研究报告的发布平台,客户仍需以海通研究所通过研究报告发布平台正式发布的完整报告为准。
市场有风险,投资需谨慎。在任何情况下,本订阅号所载信息或所表述的意见并不构成对任何人的投资建议,对任何因直接或间接使用本订阅号刊载的信息和内容或者据此进行投资所造成的一切后果或损失,海通证券不承担任何法律责任。
本订阅号所载的资料、意见及推测有可能因发布日后的各种因素变化而不再准确或失效,海通证券不承担更新不准确或过时的资料、意见及推测的义务,在对相关信息进行更新时亦不会另行通知。
本订阅号的版权归海通证券研究所拥有,任何订阅人如欲引用或转载本订阅号所载内容,务必联络海通证券研究所并获得许可,并必注明出处为海通证券研究所,且不得对内容进行有悖原意的引用和删改。
海通证券研究所金融工程对本订阅号(微信号:海通量化团队)保留一切法律权利。其它机构或个人在微信平台以海通证券研究所金融工程名义注册的、或含有“海通证券研究所金融工程团队或小组”及相关信息的其它订阅号均不是海通证券研究所金融工程官方订阅号。


分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:595
帖子:119
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP