“星火”多因子系列(二):Barra模型进阶:多因子模型风险预测

论坛 期权论坛 期权     
量化陶吧   2019-2-17 22:18   18100   0
投资要点
多因子模型风险预测:百尺竿头,更进一步
投资是一把双刃剑,投资者既是收益的追逐者,同时也是风险的承担者。一个好的多因子模型框架通常包含收益模型、风险模型、绩效归因三个模块,本报告聚焦多因子模型的第二大功能—风险预测。
多因子风险矩阵估计方法
采用多因子结构化风险矩阵估计时,为保证样本内外估计的一致性、增加估计结果的准确性,需要对因子协方差矩阵和特异风险矩阵的估计作如下调整:
因子协方差矩阵估计Newey-West自相关调整、特征值调整、波动率偏误调整
特异风险矩阵估计:Newey-West自相关调整、结构化模型调整、贝叶斯收缩调整、波动率偏误调整
多因子风险预测模型应用
在实际投资中,风险预测的应用十分广泛。本报告主要介绍如何对任意投资组合的风险进行预测,以及如何构建Smart Beta最小期望风险组合。
任意投资组合风险预测:给定投资组合权重向量,即可对其未来1个月波动进行预测,回测发现预测波动率与实际波动率走势十分相似,对于Wind全A指数,二者相关关系高达74%。
最小期望风险GMV组合:在给定投资标的的情况下,每月月底调整权重,使得投资组合的预期风险最小。研究发现,GMV组合的实际风险明显小于基准组合,夏普比率有明显的提高。
风险提示
本报告统计结果基于历史数据,未来市场可能发生重大变化。
更多交流欢迎联系方正金工张宇,联系方式:17621688421(请注明机构+姓名)
温馨提示:文末附有报告下载链接




多因子风险预测:百尺竿头,更进一步1投资是把双刃剑,投资者既是收益的追逐者,同时也是风险的承担者。与看得见的收益相比,看不见的风险通常更容易被投资者忽视。然而事实上,良好的风险控制能够帮助投资者起到事半功倍的效果。如何对投资组合的未来风险进行估计自然而然地就成为本篇报告关注的重点。
Markowitz于1952年提出采用收益率方差来度量单个资产的风险,开辟了定量度量资产风险的新纪元。然而在实际应用中发现,根据资产收益协方差矩阵得到的最优投资组合在样本外的表现往往不尽如人意。Shepard(2009)指出,在正态性和平稳性的假设下,由于估计误差的存在,采用样本协方差矩阵得到的最优投资组合的风险通常会被低估,其模型估计值与真实风险之间的关系满足:


其中,σ_true表示最优投资组合的真实波动率,σ_est为根据风险模型估计的组合风险,N表示资产数量,T为观测样本数量。例如,当采用100个交易日数据来估计50只股票收益率的协方差矩阵时,最优投资组合的估计风险仅为真实风险的1/2。此外,由于收益率序列的非平稳性,在估计样本协方差矩阵时不会选择过长的时间区间,然而市场处于交易状态的股票数量众多,当股票数量远远大于样本时间长度时,样本协方差矩阵将不可逆,且会造成较大的估计误差。根据多因子模型估计股票收益协方差,仅需对共同因子之间的协方差矩阵和股票特异风险协方差矩阵进行估计,大大降低了估计量。例如,假设市场上有2000只股票,那么直接计算其协方差矩阵需要经过200多万次运算,而采用多因子模型进行估计的次数将会大幅降低,估计准确性也有明显提高。
方正金工继续深入多因子系列研究,事实上,一个好的多因子模型框架通常会包含如下三个模块:
1)收益模型:识别与股票收益密切相关的风格因子,并刻画各个因子对股票收益率的影响方向及影响大小;
2)风险模型:引入股票收益率协方差矩阵的结构化估计方法,在降低估计参数个数的同时提高估计的稳健性和可信性,以便对投资组合未来的风险水平进行预测;
3)绩效归因:结合收益模型和风险模型,可以对投资组合的业绩和风险进行分析,帮助投资者了解收益的来源以及投资组合的风险暴露敞口。
本系列前一篇专题报告《Barra模型初探:A股市场风格解析》聚焦多因子模型的第一大功能—收益分解,通过对市场主流风格因子进行梳理,选取九大类风格因子对A股市场的风格进行解析,观察各类风格因子在历年的收益情况及方向变化情况,并将该模型应用到对任意给定投资组合的收益分解、风险敞口计算上,效果显著。
“百尺竿头,更进一步”。本篇报告是方正金工“星火”多因子系列报告的第二篇,重点关注多因子模型的第二大功能—风险预测。借助多因子模型对股票收益率协方差矩阵进行结构化估计,并将其运用到对任意给定投资组合的未来风险预测中,可以看到组合预测风险与实际风险之间的相关性较高,结果具有可信性。此外,我们还采用风险预测模型构建Smart Beta最小化方差组合,与基准组合相比,该组合的风险显著下降,组合的夏普比率较基准组合显著提升。
多因子风险矩阵估计方法2本部分将对多因子结构化风险矩阵的估计方法进行介绍,多因子模型认为资产的收益可以由共同因子驱使下的收益和资产的特异收益两部分组成,且单个资产的特异收益是互不相关的,因此在进行风险估计时就需要对风格因子协方差矩阵和特异风险方差矩阵进行分别估计。为保证样本内外估计的一致性、增加估计结果的准确性,我们将先后采用Newey-West自相关调整、特征值调整和波动率偏误调整对风格因子矩阵进行估计,采用Newey-West自相关调整、结构化模型调整、贝叶斯收缩调整和波动率偏误调整对股票特异风险进行估计,这些调整的方法及效果将在以下部分进行逐一介绍。
2.1 多因子模型回顾:
本部分对方正金工多因子模型进行一个简要的回顾:假设市场上有K个驱动股票收益的共同因子,那么多因子模型可以表示为:


其中,r_(n)为股票n的收益率,f_k为因子k的收益率,X_nk表示股票n在因子k上的暴露程度,一般取前一期的因子暴露度,u_(n)表示股票n的特质收益率。特别地,当将共同因子拆解为市场因子、行业因子和风格因子时,单只股票的收益可以表示为:


在本报告中,我们采用29个中信一级行业作为行业因子虚拟变量,风格因子的定义及计算方法如图表1所示。在采用带约束的加权最小二乘方法(WLS)对因子收益进行拟合后,即可计算得到股票收益率之间的协方差矩阵:


其中,V表示股票收益率之间的协方差矩阵,X表示股票的因子暴露矩阵,F为共同因子协方差矩阵,为股票的特异风险矩阵。若已知任意给定投资组合的权重向量W,那么该投资组合的风险为:


由此可见,在对投资组合进行风险估计时就需要先估计出风格因子协方差矩阵F和特异风险方差矩阵。



2.2 风险测度准确性评价:偏差统计量
在正式介绍如何估计协方差矩阵之前,我们还需了解如何采用偏差检验(Bias Tests)对风险测度的准确性进行度量。首先定义资产组合收益率的样本外标准化收益值:


其中,σ_t表示资产在当前时刻t的预测风险,r_(t+q)表示从当前时刻t到t+q日时间段内资产的收益率,q为预测时间长度,一般将其取为1个月(21天)。在一个检验窗口期内,计算标准化收益的标准差,即为偏差统计量:


直观地看,偏差统计量衡量的是实际风险与估计风险之间的比率,因此若对风险的估计是完美的,那么偏差统计量的值应该恰好等于1。若偏差统计量大于1,则说明低估了组合的风险;若偏差统计量小于1,则说明高估了组合的风险。然而由于样本区间段是有限的,即便对于完美的预测方法来说,该偏差统计量也会偏离于1。因此在对收益率序列的正态性假定下,我们认为较好的风险预测的偏差统计量将会落在其95%置信区间C_T内,其中:


需要说明的是,由于实际的金融数据并不服从正态性假定,而是具有“尖峰厚尾”的特性,因此上述置信区间仍然是较为严格的。

2.3 风格因子协方差矩阵估计
2.3.1 Newey-West自相关调整
传统方法直接采用股票收益率的协方差矩阵来度量股票之间的相关情况,这种方法将所有数据视为同等重要,然而现实中市场每天都会发生很多的变化,近期数据对当前状态的影响更大,因此我们采用半衰指数加权平均(EWMA)的方法计算日度协方差矩阵F^Raw,对越靠近当前日期的数据赋予越高的权重:


其中,f_(k,s)表示因子k在s期的收益,(f_k ) 表示因子k的收益在样本期内的指数加权平均,h表示样本时间长度,半衰期参数τ表示第t-τ天的数据权重为当前日的1/2,λ=〖0.5〗^(1τ)。在实际计算中,我们取h=252,τ=90。
由于我们需要对未来1个月的风险进行预测,而因子的相关系数矩阵是根据因子的日度收益数据计算得到的,因此必须考虑因子收益之间的序列相关性影响。我们可以在F^Raw的基础上进行Newey-West调整,计算得到调整后的矩阵F^NW,具体来讲:


其中,D表示滞后时间长度,C_(+)^((d) )和C_(-)^((d) )的计算方法如下,符号的上角标d表示该指标是根据日度数据计算得到的:


可以验证,二者之间满足如下关系:


在实际计算中,我们对方差和协方差的序列相关滞后时间长度均取为D=2,其他参数设置为h=252,半衰期为90。

2.3.2 特征值调整
如前文所述,直接采用协方差矩阵进行估计的方法将会对最优投资组合的风险产生明显的低估。基于此,Menchero(2011)提出采用特征值调整(Eigenfactor Risk Adjustment)的方法对协方差矩阵进行修正。对最优投资组合的风险低估与协方差矩阵特征值的概念紧密相关:在数学意义上,特征值是由因子协方差矩阵的特征向量计算得到的,从经济意义上讲,它们表示互不相关的投资组合。
将样本协方差矩阵F^NW进行特征根分解,即可得到一个对角矩阵D_0和一个正交矩阵U_0:


其中,U_0为一个N×N的正交矩阵,U_0的第k列即为F^NW的第k个特征向量,该向量中的N个元素分别表示一个特定投资组合中N个资产的权重,我们将这个特定的投资组合称为F^NW的第k个特征组合。由于U_0为正交矩阵,因此各个特征组合之间是互不相关的,并且每个特征组合资产权重的平方和为1。D_0是一个对角矩阵,其对角线上的第k个元素表示第k个特征组合的方差,其平方根即为第k个特征组合的风险。


本报告选定回测时间段为2009.1.23-2018.1.31,各因子的收益率估计在本系列报告第一篇专题中有详细介绍。图表2将特征组合按照其风险由小到大排列,绘制出各个特征组合的偏差统计量,可以看到二者之间存在明显的相关关系:低波动特征组合的实际风险要比其预测风险高得多,有的甚至高出50%以上;而高波动特征因子的偏差统计量则刚好落在95%的置信区间内,因此有必要对该协方差矩阵进行修正。
尽管并不知道真实的因子协方差矩阵,但在进行模拟的时候,可以将F^NW视为“真实”的协方差矩阵,将U_0视为“真实”的特征组合权重,将D_0视为“真实”的特征因子方差矩阵。在第m次模拟过程中,遵循如下几个步骤:
(1) 首先生成一个N×T的模拟特征因子收益矩阵b_m,其第k行元素为服从均值为0、方差为D_0第k个对角线元素D_0 (k)的正态分布随机变量,这样第k行元素的方差即为第k个特征因子的“真实”方差。
(2)根据以下公式计算得到一个N×T的模拟因子收益矩阵:


(3)计算模拟因子的协方差矩阵:


可以证明,模拟因子协方差矩阵F_m^MC是“真实”协方差矩阵F^NW的一个无偏估计,


(4)对模拟协方差矩阵进行特征值分解:


并将计算得到的模拟特征因子与“真实”的协方差矩阵F^NW结合起来,得到模拟的特征因子的真实协方差矩阵:


需要注意的是,由于U_m是模拟的特征因子而F^NW是“真实”的资产收益协方差矩阵,因此D _m并不是对角矩阵、尽管如此,依然可以将D _m的对角元素看作是第k个模拟的特征因子的真实方差。
在完成以上四步后即完成了一次模拟,我们总共进行M次模拟,并定义对第k个特征因子的模拟风险偏差为:


在模拟过程中,我们假定资产收益服从正态性和平稳性的假设,然而实际的金融数据存在“尖峰厚尾”的特性,因此在进行协方差矩阵修正之前,还需对模拟风险偏差进行适当调整:


其中, a是一个调整系数,在实际计算中,通常是一个略大于1的值,此处取为1.2。
接下来即可根据经验风险偏差γ(k)对特征因子方差“去偏”,进而得到“去偏”的协方差矩阵:


其中,γ^2是一个的对角阵,其第k个对角线元素为γ^2 (k)。最后可以通过一个正交旋转得到“去偏”的因子协方差矩阵F^Eigen:


在实际计算中,我们进行M=10000次蒙特卡洛模拟,对F^NW矩阵进行修正。首先观察模拟生成的风险偏差是否与实际的风险偏差具有相同的分布规律,图表3绘制出了模拟风险偏差统计量的均值及其1%、99%分位数,可以看到模拟风险偏差的变化规律在样本期间是非常稳定的,其规律与图表2中展现出的实际风险偏差规律一致。


图表4展示了经过本部分介绍的特征值调整过后,各个特征组合的偏差统计量,与图表2进行对比可以发现,经过特征值调整过后的特征组合偏差统计量大部分落在95%置信区间内,可以说该调整的效果十分理想。


前面提到,传统协方差估计方法会对最优投资组合的预期风险存在明显的低估。为验证特征值调整的有效性,图表5展示了经过调整前后,最优投资组合的偏差统计量对比,最优投资组合的构造方法将在2.3.4小节介绍。
通过构造100个最优投资组合并计算其样本期内偏差统计量可以发现,调整前最优投资组合的偏差统计量(Raw)显著地高于95%置信区间的上边界,这说明该风险测度方法对于风险估计存在显著的低估。而在经过特征值修正之后,最优投资组合的偏差统计量(Eigen)大部分落在置信区间内,这说明经过特征值调整过后,风险测度的准确性有较大幅度的提高。



2.3.3 波动率偏误调整
传统的多因子模型在估计单个因子的风险时,将每个因子视为独立的。也就是说每个因子本身的风险大小是通过该因子自己的时间序列数据计算得到的,与其他因子的表现情况无关。然而在实际应用中发现,这种方法将会导致风险预测存在持续的高估或低估情况,因此本部分还需进行波动率偏误调整(Volatility Regime Adjustment)。
前面介绍到,对于标准化收益f_ktσ_kt 而言,若该风险预测是准确的,那么其标准差应该等于1。前述部分提到的偏差统计量均是在时间序列上对某个资产组合的标准化收益进行计算,在进行波动率偏误调整时,我们根据日度数据,计算K个因子在横截面维度上的偏差统计量B_t^F:


该指标衡量的是每日风险预测的即时偏差(instantaneous bias),若某日所有的因子预测均低于实际风险,那么将会导致B_t^F>1。由此可以通过指数移动加权平均的方法,计算出过去一段时间内的平均偏误系数λ_F,称其为因子波动率乘数(factor volatility multiplier):


此处我们取h=252,半衰期为42。最后,需要将波动率乘数作用到特征值协方差矩阵F^Eigen上,即可得到经过波动率调整过后的最终的因子协方差矩阵F^VRA:


可以看到,波动率调整是将协方差矩阵的值进行一定程度的缩放,它并不影响因子之间的相关关系。
我们定义在t日因子横截面波动率〖CSV〗_t^F为:


图表6展示了因子波动率乘数Lambda与因子横截面波动率CSV之间的关系,可以看到二者之间存在一定的正相关关系。例如在2015年,当市场波动率增大时,由于多因子风险预测模型未能及时捕捉市场变化,将导致风险预测存在一定的低估,因此波动率乘数会显著地高于1,从而使得协方差矩阵整体上移。


图表7绘制出了在时间序列上,调整前后偏误统计量的12个月滚动平均值,可以看到与调整前相比,经过VRA调整过后的偏误统计量更接近于1。当未调整的协方差矩阵显著低估(或高估)实际风险,导致偏误统计量远大于1(或小于1)时,VRA调整的偏误统计量均在1附近。

2.3.4 不同调整下偏误统计量比较
到目前为止,我们已经对因子协方差矩阵的估计进行了完整的介绍,本部分我们构造4类投资组合,对不同调整下的投资组合偏误统计量进行比较。这四类投资组合分别是:
(1)单因子投资组合:将单个因子视为一个纯因子投资组合,本报告中共有39个因子,其中包括1个市场因子、29个行业因子、9个风格因子;
(2)随机投资组合:模拟生成100组来自标准正态分布的K×1维随机向量W_i作为随机投资组合的权重,共100个组合;
(3)特征因子组合:如2.3.2小节所述,将协方差矩阵F进行特征值分解,将所得到的特征向量U作为一个特征因子组合的权重,共39个组合;
(4)最优投资组合:假设有N只股票,其收益协方差矩阵为V,每只股票的期望收益为α=〖(α_1,…,α_N)〗^T,那么若要求解具有单位期望收益的最小风险投资组合的持仓权重,即为求解问题:


根据Grinold和Kahn(2000),持仓权重存在解析解:


本报告中我们生成100组α向量,因此可以构建100个最优投资组合。
图表8-图表11分别展示了单因子组合、随机投资组合、特征因子组合及最优投资组合在非调整(RAW)、Newey-West调整(NW)、特征值调整(Eigen)和波动率调整(VRA)四种协方差矩阵下的偏差统计量比较,样本时间选择为2009.1.23-2018.1.31。可以看到,经过调整后协方差矩阵将能够更好地对各类组合的未来风险进行预测。





2.4 特异风险方差矩阵估计
2.4.1 Newey-West自相关调整
准确的特异风险预测是结构化多因子风险模型的另一个重要因素,在模型构建中我们假定单只股票的特异风险与共同因子之间互不相关,且各股票之间的特异风险也是互不相关的,因此股票组合的特异风险Δ是一个对角矩阵,其非对角线上元素为0。
与计算因子协方差矩阵部分类似,对特异风险的方差矩阵估计同样也用到指数移动加权平均和Newey-West调整,方法完全一样,此处不加赘述。在实际计算中,我们选取样本长度h=252,半衰期τ=90,Newey-West调整滞后期D=5。

2.4.2 结构化模型调整
在实际运用中,由于新上市股票、长期停牌股票的存在,单只股票的特异风险数据可能存在一定的缺失。此外,若单个公司进行重大事件披露,将可能导致该股票的特异收益出现较大的异常值,结构化模型调整(Structural Model)正是用于解决数据的缺失性和特异收益存在异常值的问题,其基本思想很直观:具有相同特征的股票很可能也会具有相同的特异波动。具体操作如下:
(1)首先计算每只股票特异收益的稳健标准差σ_u:


其中,Q_1和Q_3分别表示该股票特异收益的1/4和3/4分位数,我们选取样本时间长度h=252。
(2)随后可计算特异收益的肥尾程度指标Z_u:


其中,σ_(u,eq)为特异收益的样本标准差,若Z_u值过大,则说明该特异收益序列中存在异常值。
(3)引入协调参数γ,并计算最终的特异风险值σ_u:


其中σ_u^NW为经过NW调整过后的特异风险,σ_u^STR为股票的结构化风险,γ是一个在0-1之间的参数。可以看到,当某只股票的特异收益数据质量不佳,如存在过多的缺失值或异常值时,将会导致协调参数γ更接近于0,因此最终计算的特异风险σ_u更偏向于使用结构化风险σ_u^STR而非根据数据本身计算得到的风险值σ_u^NW。
(4)单只股票的结构化风险σ_u^((STR))是根据回归计算得到的,对于所有γ=1的股票,进行如下回归:


其中X_nk即为股票对应的因子暴露矩阵,采用WLS回归拟合得到系数b_k后,即可对所有股票(包括γ
分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:1505
帖子:303
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP