【财通金工】“拾穗”多因子(十六):水月镜花:正视财务数据的前向窥视问题

论坛 期权论坛 期权     
量化陶吧   2019-7-30 17:42   3217   0
投资要点
水月镜花:正视财务数据的向前窥视问题
财务数据处理中主要面临两大难题:发布滞后及数据
这两大难题主要对如下三类数据的计算产生影响:同比增长率数据、单季度数据、TTM数据;
通过对多种数据修正方法进行比较发现,一点也不修正的方式存在极大的前向偏差,将会导致因子回测的表现过度虚高;而根据证监会规定的公告截止日调整尽管在处理起来相对简便,但仍然存在较为明显的滞后性;直接采用第三方数据处理后的因子可能会用到被修正的数据从而间接使用到未来数据。财通金工花了较大精力解决了财务数据的发布时间和数据修正问题,从而得到一个与实际情况最为贴近的数据集。
风险提示
本报告统计结果基于历史数据,过去数据不代表未来,市场风格变化可能导致模型失效。
更多交流,欢迎联系财通金工张宇,联系方式:17621688421 (注明机构+姓名)
欢迎在Wind研报平台中搜索关键字“星火“和”拾穗”,下载阅读专题报告的PDF版本。

本期是该系列报告的第16期,主要就策略回测中财务因子的处理细节展开探讨。发布滞后及数据修正是处理财务数据时面临的两大难题,如果不对二者进行处理,那么在回测中很容易使用到未来数据,从而得到优于实际的回测结果。在本报告中我们首先对财务数据存在的这些问题进行描述,探讨其对各种类别的数据产生的具体影响,最后以两个单季度同比指标为例对不同修正方法下的数据进行比较,从而让投资者有一个比较直观的理解。

          发布滞后及数据修正:财务数据处理的两大难题 1
随时信息化时代的到来,量化研究者使用的数据量越来越大,使用的模型越来越复杂,但是我们是否想过我们使用的数据集本身就存在一些问题?“对Alpha因子库进行搭建”是财通金工三季度的重要工作,在数据处理过程中我们难免会涉及到对财务数据的处理。与价量因子不同,财务因子的公布频率低、发布期存在滞后,且通常会对前期数据进行修正,因此如何获取特定时间点上能够获取的最新信息是我们必须重视的问题。基于此,财通金工花了较大的精力对财务数据进行清洗,初步得到一个质量相对较优的数据集。在本期讨论中,财通金工就和大家分享一下我们在数据处理过程中遇到的一些问题及解决思路,以期与各位投资者共同探讨。

1.1  看上去的美好

在进入到正文之前,我们先来观察一个单季度净利润同比增长率因子(NetProfitQYOY)的多空回测效果,其结果如图1所示。可以看到,这个因子在A股市场上多空组合的收益十分惊人,RankIC均值达到7.33%,月胜率为77%,t值达到9.45。




然而在实际投资中,单季度净利润同比增长率的效果真的如上述回测中表现地那么好吗?答案是否定的,因为上面的因子计算时在事实上使用了未来数据。在上述的因子构建时,我们首先从Wind中提取出所有股票在回测区间内的单季度净利润同比增长率数据,并随后将季度数据填充为日度数据,其填充方法如下:
(1)每年4月1日至6月30日,填充为当年一季度数据;
(2)每年7月1日至9月30日,填充为当年二季度数据;
(3)每年10月1日至12月31日,填充为当年三季度数据;
(4)每年1月1日至3月31日,填充为当年四季度数据。
很容易看到,上面这种在季度结束之后立即采用当季数据进行填充的方式是存在问题的。由于上市公司定期报告通常具有一定滞后期,在季度结束之后的翌日并不能立即获取到上市公司的财务信息,因此这种处理方式实际上使用了未来数据,因此该因子看上去的回测效果在实际应用中如水中月、镜中花般不可企及了。

1.2  发布滞后及数据修正


财务数据的处理通常会面临发布滞后及数据修正问题,本小节我们将就这两个方面进行探讨。



首先是发布滞后问题,根据证监会发布的《上市公司信息披露管理办法》第二十条,上市公司的定期报告发布的时间规定如下:
(1)年度报告应当在每个会计年度结束之日起4个月内;
(2)中期报告应当在每个会计年度的上半年结束之日起2个月内;
(3)季度报告应当在每个会计年度第3月、第9个月结束后的1个月内编制完成并披露。

根据上述条款,我们即可大概总结出各类定期报告的披露截止日的规定:
(1)一季报:最迟4月30日;
(2)半年报:最迟8月30日;
(3)三季报:最迟10月30日;
(4)年报:最迟次年4月30日。
对于上市公司公告发布时间的规定,相信绝大多数投资者都有详细的了解,但是财通金工想要提醒如下两点:
首先,并非所有公司都会按照如上规定的截止日期公布定期报告。如表1所示,有三家上市公司直至5月和6月底才公布2018年年报及2019年一季报,这一时间点已经大大超出了证监会规定的截止日期。当然我们也可以看到,这样的股票毕竟只是少数,而且全部都是ST股票。此外,公司在证监会规定截止日之前还会发布《关于预计无法在法定期限披露定期报告的风险提示公告》。



其次,信息发布滞后的另一个需要注意的地方在于,很多上市公司的一季报和年报会选择在同一时间公布。以2018年年报和2019年一季报公布日期为例,展示了A股共3638家公司的公布日期间隔天数的直方图。可以看到,共有1245家公司的年报和季报选择在同一天公布(占比34%),间隔时间不足5天的上市公司达到1629家(占比45%),间隔时间不足10天的上市公司达到1981家(占比54%)。如果公司的年报和一季报数据同时公布,那么在使用资产负债表中的指标时,我们就应该采用当前时刻能够获取到的最新数据。


数据修正是财务因子面临的第二个问题,通常公司在发布定期报告时会对过往报告期的数据进行修正(通常在两年以内的报告期)。关于数据修正,财通金工提醒大家注意如下三点:
(1)财务数据的修正有时并不需要很长的时间,有时在短短的一个季度甚至一个月内就会存在数据修正。如吉峰科技(300022.SZ)在2019年4月28日发布一季报后,随即在4月30日又发布了一次补充更正报告。
(2)前面提到,很多上市公司的年报和一季报会在同一时间公布。然而,这两个报告中对于同一报告期的同一指标数据也未必相同,也就是说公司的一季报会对年报数据进行更正,尽管这两个公告是在同一天发布的。例如,中原特钢(002423.SZ)的年报和一季报均在2019年4月30日发布,其中年报中披露的归属母公司股东所有者权益合计为14.55亿元,而一季报中披露的该指标为178.7亿元。
(3)如果单纯地从WindAPI接口中提取历史数据,那么将很可能提取的是经过修正后的指标。例如东软载波(300183.SZ)在2019年5月30日对前期的数据进行了更正,此时Wind采取的是直接覆盖式的处理方法。

1.3  细分基础因子的计算

在了解了财务数据可能存在的问题之后,下面我们探讨其可能对哪些类别的数据计算造成影响,此处我们分别讨论同比增长率数据、单季度数据和TTM数据三种:

(1)同比增长率:财务数据的同比增长计算相对简单,即将本期数据除以去年同期数据再减去1即可;
(2)单季度数据:对于单季度数据,一、三季度数据直接采用报告中的数据,二季度数据等于半年报数据减去一季度数据,四季度数据等于年报数据减去三季度数据;
(3)TTM数据:如果最新报告期是年报,则TTM数据等于年报数据;如果最新报告期不是年报,则TTM = 半期数据 + (上年年报 –上年同期合并数);
为了描述的简便性,图4以TTM指标计算为例,简要说明存在数据修正的情况下如何计算更符合实际的数据。假设在2018年9月30日对2017年年报中的数据进行了修正,那么在6月30日时,计算该指标还只能用原始值,但是在9月30日的时候就应该用修正过后的指标了。



哪些指标容易被修正? 2在理解了财务因子存在的部分问题后,本小节我们从资产负债表、利润表和现金流量表中,观察每个报告期各个指标存在修正的公司数量,并取中位数或者平均数,从而方便投资者对经常被修正的指标有更加直观的认识(报告期取2010年一季报到2019年三季报)。如果在某些指标中存在修正的公司数量较多,而该指标是我们通常用于构建Alpha因子的指标,那数据修正问题就更加值得引起我们的重视。


图5展示了资产负债表中,历年报告期存在修正的公司数量平均值排名前十五的指标,可以看到经常被修正的数据有负债和所有者权益合计、资产总计、负债总计、归属母公司股东权益合计等数据,这些数据通常被用于杠杆率、ROE、ROA等因子的计算中。


图6展示了利润表中,历年报告期存在修正的公司数量中位数排名前十五的指标,可以看到经常被修正的数据有归属母公司所有者的综合收益、营业利润、净利润、营业收入、管理费用等指标,这些指标常用于成长因子和盈利因子的计算。


图7展示了现金流量表中,历年报告期存在修正的公司数量中位数排名前十五的指标,可以看到经常被修正的数据有经营活动产生的现金流量净额等数据,这些指标常用于衡量公司的营运能力。


水月镜花:不同方法修正的财务数据后果比较 3
本次讨论的最后一个部分,我们来关注不同的数据修正方法对最终的策略回测的影响究竟存在怎样的区别。我们分别对如下几种方式进行调整:

(1)不修正:不考虑信息发布滞后及数据修正问题,在每个季度结束之后的第二日即认为可以获得上一季度对应的数据,这种数据处理方法的偏差最为严重;
(2)调整方法1:仅考虑数据发布的滞后问题,从Wind中一次性提取每个报告期的数据及对应的发布时间,根据发布时间向后填充。这种方法考虑到了信息的发布滞后问题,但是对数据的修正未做处理,一定程度上用到了未来数据;
(3)调整方法2:同样考虑发布的滞后问题,从Wind中一次性提取每个报告期的数据,并按照证监会规定的公告发布截止时点进行填充,具体表现为:4月30日之后可使用一季度数据、8月31日之后可使用半年报数据、10月31日之后可使用三季报数据、次年4月30日之后可使用年报数据。这种修正方法处理起来最为方便,在一定程度上考虑了信息的发布滞后问题,但由于部分公司会在截止日之前发布公告,因此这种方式的信息过于滞后,同样未对数据修正进行处理;
(4)调整后:同时考虑信息发布的滞后及数据修正的问题,深入到每个公告的发布时点上,获取该发布时点时投资者能够获得的最新数据,并根据当下所能获得的最新数据计算因子指标,这种处理最为复杂,但是与实际能够获得的数据最为接近,不存在未来数据的使用问题。
下面我们以单季度净利润同比增长率和单季度营业收入同比增长率因子为例,展示不同修正方法下在全样本股票中的多空组合的净值比较。


图8展示了三种修正方法下单季度净利润同比增长率因子的多空组合净值比较,可以看到,仅考虑发布滞后问题但不考虑数据修正问题的调整方法1的表现最佳,因为它在一定程度上使用了未来数据;相较之下,按照证监会规定的公告发布截止时点进行调整的调整方法2由于存在一定程度的信息滞后,所以其表现最差;而财通金工处理得到的最为接近实际的数据集的表现居于中间,它反映了该因子的真实表现。


下面我们对单季度营业收入同比增长率因子的不同修正情况下表现进行考察,图9展示了不考虑发布滞后及数据修正的情况下该因子在全A股中的选股情况,其RankIC达到4.07%,月胜率70%,t值达到6.28,但是这一因子存在严重的前向窥视问题,与实际情况最不相符。

图10展示了三种修正方法下单季度营业收入同比增长率因子的多空组合净值比较,可以看到,仅考虑发布滞后问题但不考虑数据修正问题的调整方法1的和经过多项调整的真实数据集的表现比较类似,而按照证监会规定的公告发布截止时点进行调整的调整方法2由于存在一定程度的信息滞后,其表现大幅落后调整后的真实因子走势。

小结 4本期“拾穗”系列专题,我们对财务因子的处理细节展开讨论,介绍财务数据处理过程中面临的问题及解决方法的比较,主要结论如下:
(1)财务数据处理中主要面临两大难题:发布滞后及数据修正;
(2)在计算财务因子的同比增长率数据、单季度数据和TTM数据时,尤其需要考虑数据修正带来的影响;
(3)通过对多种数据修正方法进行比较发现,一点也不修正的方式存在极大的前向偏差,将会导致因子回测的表现过度虚高;而根据证监会规定的公告截止日调整尽管在处理起来相对简便,但仍然存在较为明显的滞后性;直接采用第三方数据处理后的因子可能会用到被修正的数据从而间接使用到未来数据。财通金工花了较大精力解决了财务数据的发布时间和数据修正问题,从而得到一个与实际情况最为贴近的数据集。

风险提示 5本报告统计结果基于历史数据,未来市场可能发生重大变化。

报告原文地址及相关报告
原始报告:
证券研究报告:“拾穗”多因子系列(十六):《水月镜花:正视财务数据的前向窥视问题》
发布时间:2019年7月16日
分析师:陶勤英 SAC证书编号:S0160517100002
联系人:张宇 17621688421

下载地址:
链接:https://dwz.cn/ruXAFVKE  提取码:o5zc
欢迎在Wind研报平台中搜索关键字“星火“和”拾穗”,下载阅读专题报告PDF版本

星火”系列专题报告:
【巡礼篇】财通金工一、二季度多因子系列专题汇总
“星火”多因子系列(一):Barra模型初探:A股市场风格解析
“星火”多因子系列(二):Barra模型进阶:多因子模型风险预测
“星火”多因子系列(三):Barra模型深化:纯因子组合构建
“星火”多因子系列(四):基于持仓的基金业绩归因:始于Brinson,归于Barra
“星火”多因子系列(五):源于动量,超越动量:特质动量因子全解析
拾穗”系列专题报告:
“拾穗”多因子系列(一):带约束的加权最小二乘拟合:一种解析解法
“拾穗”多因子系列(二):你看到的不一定是你所想的:解密R方
“拾穗”多因子系列(三):行业因子选择:中信一级还是申万一级?
“拾穗”多因子系列(四):总市值、流通市值、自由流通市值:谈谈取舍
“拾穗”多因子系列(五):数据异常值处理:比较与实践
“拾穗”多因子系列(六):因子缺失值处理:数以多为贵
“拾穗”多因子系列(七):从纯因子组合的角度看待多重共线性
“拾穗”多因子系列(八):非线性规模因子:A股市场存在中市值效应吗?
“拾穗”多因子系列(九):牛市抢跑者:低Beta一定代表低风险吗?
“拾穗”多因子系列(十):行业的风格偏好:解析纯行业因子组合
“拾穗”多因子系列(十一):多因子风险预测:从怎么做到为什么
“拾穗”多因子系列期中总结
“拾穗”多因子系列(十二):权重复刻:指数成分股调整,股指期货分红点位测算更新
“拾穗”多因子系列(十三):恼人的显著性检验:多因子模型中t值的计算
“拾穗”多因子系列(十四):补充:基于特质动量因子的沪深300增强策略
“拾穗”多因子系列(十五):是聪明钱吗?探析外资持股的风格偏好

法律声明

根据《证券期货投资者适当性管理办法》(2017年7月1日正式实施),本订阅号发布的观点和信息仅供财通证券专业投资者参考,完整的投资观点应以财通证券研究所发布的完整报告为准。若您并非专业投资者,请勿订阅或转载本订阅号中的信息。若您并非财通证券客户中的专业投资者,为控制投资风险,请取消订阅、接收或使用本订阅号中的任何信息。
本订阅号旨在沟通研究信息,分享研究成果,所推送信息为“投资参考信息”,而非具体的“投资决策服务”。本订阅号推送信息仅限完整报告发布当日有效,发布日后推送信息受限于相关因素的更新而不再准确或失效的,本订阅号不承担更新推送信息或另行通知义务,后续更新信息请以有关正式公开发布报告为准。
市场有风险,投资需谨慎。在任何情况下,本订阅号中的信息所表述的意见并不构成对任何人的投资建议,订阅人不应单独依靠本订阅号中的信息而取代自身独立的判断,应自主做出投资决策并自行承担投资风险。本资料接受者应当仔细阅读所附各项声明、信息披露事项及相关风险提示,充分理解报告所含的关键假设条件,并准确理解投资评级含义。在任何情况下,信息发布人不对任何人因使用本订阅号发布的任何内容所引致的任何损失负任何责任。




分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:1505
帖子:303
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP