因果效应归属为一类特殊的回归问题,处理对象的结果变量 ![]()
与处理变量 ![]()
之间存在因果效应可以视为结果变量与处理变量之间随时间变化的动态关系在treatment前后存在结构性断点/变化(Structural Break/Change)的一种情况,所以如果存在treatment effect我们就可以用回归分析中structural break detecting的方法来检测因果效应,structural break的大小就是treatment effects的大小。但是,反过来不成立,有structural break不一定意味着存在因果效应!因此,在回归分析(Switching Regime Model)的框架下以下我们来证明上述关系(逆推不一定成立!)。如果因果效应存在,我们尝试能否不构建结果变量 ![]()
与处理变量 ![]()
之间的关系式 ![]()
来判断因果效应的大小(不构建reduced/structural form的原因在于规避model misspecification的风险、model assumptions以及异常值等等)。
一、动态关系建模
对于时间序列点![]()
,我们考虑研究对象在时间序列轴 ![]()
上的测量数据 ![]()
,我们进而将这个随时间变化的演变系统简化为
![]()
(1)
其中 ![]()
为square integrable的实函数,0为 ![]()
的列向量, ![]()
为 ![]()
的结构性外生冲击, ![]()
为研究对象在时点 ![]()
上的测量数据,m为样本容量。对于式(1),我们假设随机向量![]()
的遍历稳态(Steady State)为 ![]()
,满足 ![]()
,且外生冲击满足 ![]()
。我们考虑方程(1)在稳定态![]()
处的一阶泰勒展开
![]()
(2)
其中 ![]()
为![]()
的向量, ![]()
为函数 ![]()
在![]()
处求偏导的Jacobian矩阵,即矩阵的第(i,j)个元素为式(2)中第i个方程对![]()
中的第j个元素的偏导数。定义
![]()
, ![]()
, ![]()
(3)
则式(2)可以转化为线性方程组
![]()
(4)
于此,假设在以上研究对象之外,我们还对另外的研究对象感兴趣,并希望定量分析他们之间相互关系随时间的变化关系,那么由式(4),有
![]()
(5)
![]()
(6)
其中 ![]()
分别为研究对象 ![]()
自身演变的Jacobian矩阵。现在我们考虑将时间因素直接纳入分析中
![]()
(7)
![]()
(8)
我们考虑方程(7)、(8)对时间的导数: ![]()
,![]()
,那么我们感兴趣的式(1)就转变为
![]()
(9)
与式(1)相比,式(9)描述的是一个微分方程系统,我们试图构建微分方程来描述不同研究对象之间的相互作用关系是如何随时间的变化而变迁的。由式(4)易得
![]()
(10)
其中 ![]()
分别为两个研究对象随时间变化的稳态,即![]()
,使得式(9)同时也满足 ![]()
。同理,由式(4)、(5)、(6)可得
![]()
![]()
(11)
以及
![]()
(12)
由式(11)可得
![]()
![]()
(13)
将联立式(13)代入到式(12)中,即可得到方程(9)的一组线性表达
![]()
(14)
由此,不同研究对象之间的关系即可由上式(14)所示的一个微分线性随机过程来描述。值得注意的是,尽管式(2)被写为一个一阶线性系统,然而其实高阶系统与模型也可以包含入内,考虑如下任意 ![]()
阶方程
![]()
(15)
其中![]()
为滞后阶数。事实上,式(15)也可以写为一阶的形式
![]()
简记为
![]()
(16)
由此同理可得
![]()
(17)
![]()
(18)
我们将式(17)、(18)代入到式(14)中,最终得到
![]()
(19)
由式(17)、(18),此时根据式(19),只要我们已知 ![]()
之中的任意一个就可以求出另一个。基于式(19),我们可以做以下东西:
- 构建不同研究对象自身随时间变化而变迁、演变的定量模型,对未来演变趋势做定量预测;
- 构建几个不同研究对象之间的相互关系随时间演变、变化的动态模型,不仅可以对相互关系进行预测,还可以通过其中一个研究对象的演变预测其他研究对象未来的演变趋势;
- 检验几个不同研究对象之间的相互关系随时间的演变是否存在结构性突变(Structural Breaks/Changes),自动侦测到结构突变点;
- 定量评估研究对象之间的相互关系是否会受到外生因素随机冲击的影响,以及影响的大小。
二、结构断点/变化与因果效应
为了简便,我们考虑最简单的情形:完全随机实验下的处理效应估计(RCT),结论同样可以推广到观测研究(Observable Study)的情形上。由上所述,我们构建起来的式(19)可以detect出结构断点,以下我们证明当因果效应存在的时候,这个结构断点其实就是treatment effects,即如果treatment effects不为零,那么结果变量 ![]()
与处理变量 ![]()
之间潜在的Regime shift model在treatment前后一定有一个结构变化或断点。由式(7)、(8),我们考虑![]()
自身演变是关于时间序列的一个二元函数
![]()
![]()
(20)
通过OLS得到其中的参数后,我们分别对式(20)的时间 ![]()
求导,得到
![]()
![]()
(21)
于此,容易找到一个关系函数 ![]()
使得式(19)成立
![]()
(22)
由此,式(14)就转变为
![]()
(23)
其中 ![]()
。由式(22),将估计出来的参数代入进去,我们可以得到
![]()
(24)
记 ![]()
为接受treatment时我们关注的结果变量的拟合预测值。那么我们进而考虑回归模型
![]()
(25)
通过OLS得到式(25)的参数后,对式(25)进行预测得到
![]()
(26)
则我们可以得到以下命题:
命题 ![]()
(证明略)
由此可见,我们可以将treatment effect与structural break/change的switching regime model纳入到一起,二者之间有一个相互沟通的“桥梁”!
三、美国民主党参议员竞选实证研究
我们用一个真实的例子来验证上述推理,证明当存在treatment effects的时候因果效应的估计可以用结构断点/变化检测的方法来做。我们从美国大学政治与社会联合研究会(ICPSR)收集到1914年至1990年间美国参议院参议员电子选举投票结果,以及从CQ选举投票及电子选举集合(lections Collection)中收集到1990年至2010年间的参议院参议员选举投票结果;其余数据来源于美国参议员历史办公室(Senate Historical Office)。数据集包含两个变量:结果变量Y是美国民主党成员参选当期参议院参议员在全国各州获得的投票数,取值范围为0~100;原因变量X是民主党参选参议院同样职位时前一期获得的盈余,盈余等于民主党得票数减去最强竞争对手的得票数,取值范围为-100~100。盈余大于零时,民主党赢得选举,反之则输掉选举。由此,我们想要研究前一期选举的结果是否会对当期的选举结果造成影响,即检验美国宪法直接选举制度下选民的选举行为是怎样的,选票是怎样投出来的,投票的行为心理特征是什么。
采用本文提出的基于动态测量的结构断点检测新方法,最终得到分析结果:
![]()
图1 美国民主党参议员竞选当期、前期结果关系的结构断点/变化检验由图10左图与中图可见前一期美国民主党竞选参议院得票状况与当期竞选得票状况关系存在一个明显的结构性断点,且结构断点大概发生在x=595处附近。再结合图10中的右图可以发现,当前一期竞选结果盈余大于零时,当期竞选得票数有一个显著的上升过程。这表明在美国的参议院竞选活动中,参选主体之前的竞选结果会显著的影响其之后竞选的结果。这与采用断点回归(RD)方法得到的结果一致:
![]()
图2 美国民主党参议员竞选当期、前期结果关系的断点回归结果图1与图2的实证分析结果表明在定量实证研究中,因果效应可以被视为研究对象间相互关系存在结构性断点的一种特殊情形,当存在因果效应时,我们可以用结构变化的回归方法去进行分析。
四、思考与展望:beyond structural & reduced form
众所周知,定量实证研究的范式分为两种:简约式与结构式。那么我们的问题是,除此之外,还有其他的范式来进行因果推断吗?
我认为随着大数据时代的到来,机器学习方法的发展,很可能还存在着一种基于理论关系的inference free of model specification的研究范式来进行因果推断,这种方法与范式不依赖于模型的设定、模型的假设并且对异常值、缺失值的干扰更加稳健。
References
Alonso C, Gutierrez J, Recio T, A Rational Function Decomposition Algorithm by Near-separated Polynomials, 19(6) Journal of Symbolic Computation, 527(2007)
Alonso C, Gutierrez J, Recio T, A note on separated factors of separated polynomials , 121(3) Journal of Pure & Applied Algebra, 217(1997)
Calonico, S., M. D. Cattaneo, and R. Titiunik, rdrobust: An R Package for Robust Nonparametric Inference in RegressionDiscontinuity Designs, 7(1) R Journal, 38(2015)
Social Research Center of the Michigan University, “Politics Data Sets”, https://www.icpsr.umich.edu/icpsrweb/, accessed September 7, 2019
US Government, “Art and History”, https://www.senate.gov/artandhistory/history/common/generic/Senate_Historical_Office.htm, accessed September 25, 2019
|