2019 Stata 寒假班 DAY

论坛 期权论坛 期权     
Stata连享会   2019-2-9 00:02   5485   0
[h1]2019 Stata 寒假研讨高级班第二天[/h1]
上午 —— 面板门槛模型
  • 面板门槛模型
    • 模型设定
    • 估计方法
    • 假设检验
在上午的课程中,连老师首先介绍了面板门槛模型。当模型结构出现突变时,典型的处理方法有加入解释变量的二次项,加入虚拟变量和交乘项,或者分组回归,但上述处理方法往往容易导致高度共线性,或者因为错误的界点导致严重的偏误。因此,我们引入了面板门槛模型,门槛模型的核心问题是找出具体的门槛值q。在搜索门槛时,可以先搜索第一个第一个门槛t1;固定第一个门槛t1,搜索第二个门槛t2;重复上述过程2-3次,即可确定最终的门槛。接下来,连老师以单一门槛为例,来检验模型里是否存在门槛效应。在这个假设检验中,连老师向我们详细介绍了Bootstrap步骤。Bootstrap也称作可重复抽样,这种方法可以很好的缓解异方差的问题。

门限效应假设检验在实操过程中,连老师以一份模拟数据为例,用stata程序向我们展示如何寻找门槛值,并对模型进行回归。首先连老师估计了三重门槛模型,结果发现stata寻找出来的三重门槛中,只有其中两个门槛是显著成立的。接下来,连老师带我们估计了双重门槛模型,具体命令为
  1. xthreg y z, rx() qx() thnum() grid() trim() bs()
复制代码

面板门槛模型估计
下午 —— 内生性和 RDD
  • 自选择问题和处理效应模型
    • 自我选择偏误
    • Heckman模型
    • 处理效应模型
  • 断点回归设计(RDD)
自我选择偏误作为内生性问题的一种重要情况,主要是由于被解释变量中包含缺漏值引起的,缺漏值通常分为随机缺失和非随机缺失两种。连老师以妇女工资为例,生动形象地向我们解释了由于自我选择偏误引致的内生性问题。例如全样本有753个,而有工资的妇女样本观测值只有428个,如果我们想要研究妇女工资的影响因素,就可能存在自我选择偏误,所以我们采用了Heckman两步法来纠正这个偏差。

自我选择偏误Heckman两步法的 Stata 命令如下
  1. heckman depvar [indepvars], select(varlist_s) [twostep]
复制代码
,这条命令里,select 代表设置选择方程,末尾如果加上 twostep 代表 Heckman 两步法估计,如果不加,就默认为 HeckmanMLE 估计。第一步,我们需要计算女性工作的概率,将影响是否工作的变量放在 select 括号中,即这几个变量构成选择方程的解释变量,选择方程的被解释变量为“是否工作”这一虚拟变量。第二步将计算出的概率放到主回归方程中。接下来,连老师对比了OLS,Heckman2s,HeckmanMLE 三种估计方法的差异。对比回归系数发现,OLS 的估计量明显偏高,Heckman的两个估计量 mills,athrho 显著结果均表明,OLS的估计结果是有偏的,采用 Heckman 模型更为恰当。
Heckman选择模型
Heckman模型回归然后,连老师以大学毕业是否有助于获得更高的薪水为例,向我们介绍了处理效应模型:一个简单的理解,Heckman通常是如果不选择,你就没有办法观测到因变量,如果选择就可以观察到因变量。而处理效应是不管选择不选择,都能观察到因变量,适用于样本类型明确给定的情形。stata命令为
  1. Treatreg
复制代码
。对比前期文献,可以发现,OLS,GMM与Treatreg 的结果存在巨大差异:OLS 低估了关键变量的贡献,GMM 无法很好地处理0/1内生变量,Treat 模型的估计结果较为合理,但是遗漏变量也可能导致估计偏误。


处理效应模型在下午剩余的时间里,连老师向我们讲解了断点回归设计,也就是大名鼎鼎的 RDD。断点回归设计,本质上还是 OLS 回归,主要是在回归中,加入了虚拟变量。传统的估计方法针对全样本进行回归,结果是有偏的;错误判断了 average treatment effect ;此外,由于y=f(x) 是非线性的,因此如果在分界点两侧采用直线拟合,会错以为存在处理效应。对于断点回归设计,我们采用局部线性回归,并且通常都会预先对分配变量进行中心化处理,因此多数 RDD 命令的cut()或thres()选项一般都默认为0。在 RDD 分析中,还有一个关键的问题是,最优带宽的选择。当x y是线性关系是,不同的带宽不影响回归结果,但是当x y是非线性关系时,不同带宽的影响就非常大了。此外,连老师还以图形的方式,形象地给我们展示了断点回归的和拐点回归的区别,这两者的不同之处主要在于突变之处截距项是否相同。

断点与拐点
课后答疑

课后答疑最后连老师在答疑过程中向有疑问的同学深入浅出地解释了断点回归与门槛模型的区别,简单来讲,断点回归主要是用于政策评价(给定断点),门槛模型适用于突变点未知,需要自己估测门槛值的情形!
感谢连老师一天下来的辛苦教学,高级班课程还剩最后一天了,希望大家再接再厉,牢牢掌握住所学知识,用在以后的科研过程中。
[h3]往期精彩推文[/h3]



欢迎加入Stata连享会(公众号: StataChina)

分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:190
帖子:39
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP