ardl模型stata命令_小白学统计|面板数据分析与Stata应用笔记(三)

论坛 期权论坛 编程之家     
选择匿名的用户   2021-5-31 17:06   1859   0

3b38dbb5e5a76ec2bc937d87d54ce002.png

#文章首发于公众号“如风起”。

原文链接:

小白学统计|面板数据分析与Stata应用笔记(三)mp.weixin.qq.com
cfc1da8c12a7753505fcd5700772ac89.png

面板数据分析与Stata应用笔记整理自慕课上浙江大学方红生教授的面板数据分析与Stata应用课程,笔记中部分图片来自课程截图。

笔记内容还参考了陈强教授的《高级计量经济学及Stata应用(第二版)》

长面板数据分析

上两篇笔记我们讲到了短面板数据分析。短面板数据分析主要关注对不可观测的个体效应的处理,而对于误差自相关、异方差和截面相关的问题只提供经过校正的标准误。

与短面板数据不同,长面板数据分析主要关注对误差项的处理(因为时间T大),而将个体效应用虚拟变量来控制(因为个体n小)。

所以,对于长面板数据分析,我们不需要在固定效应模型、随机效应模型和混合回归模型之间进行选择,长面板数据分析先验假定长面板数据模型就是固定效应模型。

此外,需要注意的是,短面板数据分析对于时间效应,用虚拟变量来控制,而长面板数据分析,由于时间T相对较长,为避免损失较多的自由度,所以一般则用时间趋势项来控制。

可以认为长面板数据模型是一个特殊的双向固定效应模型。在这个模型中,个体效应用虚拟变量控制,时间效应用时间趋势项控制,长面板数据模型的估计主要关注对误差项的处理。

一、长面板数据模型的估计方法

通常有三种方法对长面板数据模型进行估计。

第一种:使用OLS估计这个特殊的双向固定效应模型,并对误差项的自相关、异方差和截面相关的问题只提供面板校正的标准误(使用命令xtscc或xtpcse命令实现),这种估计方法最为稳健。

第二种:如果存在自相关、异方差和截面相关的问题,则使用FGLS估计这个特殊的双向固定效应模型,这种方法只是解决了误差项自相关的问题,而并未考虑异方差或截面相关的问题,对于误差项的异方差和截面相关的问题仍然只是提供面板校正的标准误(使用命令xtpcse实现),这种估计方法介于稳健和效率之间。

第三种:使用FGLS估计这个特殊的双向固定效应模型,对误差项的自相关、异方差和截面相关的问题一并加以处理(使用命令xtgls实现),这种估计方法最有效率。

二、长面板数据模型的Stata估计命令

常用的估计长面板数据模型的Stata命令有三个:【xtpcse】、【xtgls】和【xtscc】

对于【xtscc】命令,我们在前两篇短面板数据的笔记中已经讲过,【xtscc】也适用于长面板数据分析,它可以实现长面板数据模型的第一种估计方法,对误差项的自相关、异方差和截面相关问题提供面板校正的标准误。

下面,我们讲一下【xtpcse】和【xtgls】估计命令

1、【xtpcse】命令

基本命令格式:

xtpcse depvar indepvars,options

#命令的关键在于选项(options),不同的选项可以处理不同的问题。

对于误差项三大问题【xtpcse】命令选项(options)的使用

(1)自相关问题(一阶自相关)

a.使用选项:corr(ar1),使用的估计方法为FGLS

#误差项存在自相关时使用该选项;当T不比n大很多时使用该选项,因为此时T可能无法提供足够多的信息去估计每个个体的自相关系数,所以约束了每个个体的自相关系数都相等

b.使用选项:corr(psar1),使用的估计方法为FGLS。

#误差项存在自相关时使用该选项;当T比n大很多时使用该选择项,当T比n大很多时每个个体的自相关系数可以不同,就可以使用选项

c.使用选项:corr(independent)或corr(ind),使用的估计方法为OLS。

#误差项不存在自相关时,使用该选项

(2)异方差与截面相关问题

a.使用选项:independent

#误差项不存在异方差和截面相关问题,使用该选项

b.使用选项:hetonly(提供考虑异方差的面板校正标准误)

#误差项存在异方差但不存在截面相关问题,则使用该选项

c.使用选项:不加选项即可(提供既考虑异方差又考虑截面相关的面板校正标准误)

#误差项存在异方差和截面相关问题时,不加任何选项

选项:corr(ind)+independent等价于LSDV

2、【xtgls】命令

基本命令格式:

xtgls depvar indepvars,options

#如果对误差项的处理正确,那么【xtgls】比x【tpcse】估计效果更好

对于误差项三大问题【xtgls】命令选项(options)的使用

(1)自相关问题(一阶自相关)

【xtgls】与【xtpcse】命令的选项对自相关问题的处理是相同的

a.使用选项:corr(ar1),使用的估计方法为FGLS

#误差项存在自相关时使用该选项;当T不比n大很多时使用该选项,因为此时T可能无法提供足够多的信息去估计每个个体的自相关系数,所以约束了每个个体的自相关系数都相等

b.使用选项:corr(psar1),使用的估计方法为FGLS。

#误差项存在自相关时使用该选项;当T比n大很多时使用该选择项,当T比n大很多时每个个体的自相关系数可以不同,就可以使用选项

c.使用选项:corr(independent)或corr(ind),使用的估计方法为OLS。

#误差项不存在自相关时,使用该选项

(2)异方差与截面相关问题

a.使用选项:panels(iid)

#误差项不存在异方差和截面相关,使用该选项

b.使用选项:panles(heteroskedastic)

#误差项存在异方差但不存在截面相关问题时,使用该选项

c.使用选项:panels(correlated)#只适用于长面板数据

#误差项存在异方差和截面相关问题时,使用该选项

选项:corr(ind)+panels(iid)等价于LSDV

三、长面板数据分析的实例操作

#以数据集“mus08cigar.dta”为例估计香烟需求函数,数据来源于慕课上浙江大学方红生教授的面板数据分析与Stata应用课程中。

“mus08cigar.dta”数据集包括了美国10个州1963-1992年有关香烟消费量的相关变量。

参考上一篇文章短面板数据分析的基本程序,我们对长面板数据进行分析。

第一步 模型设定与数据

长面板数据不需要进行模型的选择,我们构造一个双向固定效应模型

其中,被解释变量lnc为人均香烟消费量的对数,解释变量:lnp为实际香烟价格的对数,lnpmin为相邻州最低香烟价格的对数,lny为人均可支配收入的对数。

在Stata软件中对数据进行分析,执行如下步骤:

1、导入数据到Stata中

在Stata的“命令窗口”中输入命令

use"数据集路径mus08cigar.dta"

将“traffic.dta”数据集导入到Stata中,

例如

use"C:Usersmus08cigar.dta"

将数据导入Stata后,即可在Stata的“变量窗口”中看到“mus08cigar”数据集中的各个变量的名称及其标签。

384c8263a3a4d1c827c2493c943f915e.png

2、查看数据

在Stata的“命令窗口”输入命令

des

和命令

xtdes

查看“mus08cigar”数据集。

e6f11e58c0b8015de35e61c27d4862f1.png

7ecd685c5b5c1bf94a2b6237b5b9ca4b.png

从输出结果我们可以看到:“mus08cigar”数据集包含300个观测值,6个变量。

面板数据的截面数 ,时间数 , ,说明这是一个长面板数据集。

输入命令

xtset state year

告诉Stata软件,这是一个以截面变量state为州,时间变量为year的面板数据。

bb9f451d371776489ab47bf647f39b77.png

由“strongly balance”可知,这是一个平衡面板数据。

至此,我们可以知道,“mus08cigar”数据集是一个10个州,1963-1992年的长面板数据集且为平衡面板数据集。

第二步 描述性统计作图

1、描述性统计

使用命令【sum 关键变量】可以得到关键变量的描述性统计表。

在Stata中输入命令

sum lnc lnp lnpmin lny

得到解释变量与被解释变量的观测值、均值、标准差、最小值和最大值。

6875e7c437667ae2c0bcfcf68d469caf.png

2、绘制散点图及回归直线

在回归之前,我们先画出核心变量lnp与被解释变量lnc的散点图及回归直线,来预先观测一下核心变量与被解释变量之间是否存在理论上预期的负相关系。

使用命令

twoway(scatter lnc lnp)(lfit lnc lnp)

画出核心变量“lnp”与被解释变量“lnc”的散点图及回归直线。

d536cfd8b4178da32a44e1447ecce8d0.png

由结果可知,lnp与lnc之间是负相关系的,与理论预期一致。

接下来,我们做出相邻州的香烟价格的对数与被解释变量的散点图及回归直线,看一下核心变量lnpmin与被解释变量lnc之间是否存在理论上预期的正相关系。使用命令

twoway(scatter lnc lnpmin)(lfit lnc lnpmin)

e670a42a9f15b20737742577eda306c1.png

由结果可知,相邻州的香烟价格的对数lnpmin与被解释变量lnc之间是正相关系的,这与我们的理论预期并不符合。

不过,因为我们并没有控制其他的影响因素,所以这个结果并不是完全正确的,在之后的操作中,我们可以使用命令【avplot】绘制变量之间的偏相关图。

3、绘制核心变量的时间序列图

使用命令

xtline lnc

做出核心变量人均香烟消费的对数lnc在各个州的时间序列图,以研究分析人均香烟消费的对数lnc在每个州中的变动趋势。

fa82d23c0703caa532d36d7d7b0706a6.png

观察lnc在各个州的时序图,我们可以发现,1980年之后,所有州的人均香烟消费率基本都呈现出下降趋势。

使用命令

xtline lnp

做出美国10个州1963-1992年实际香烟价格对数的时间序列图。

0cf3632edddad6af795b86015afe87d9.png

观察发现:1980年之后,所有州的香烟价格基本都呈现了上升的趋势。

第三步 模型估计

首先,我们先假定不存在自相关、异方差和截面相关这三大问题,使用LSDV估计双向固定效应模型。

依次进行如下操作:

使用命令

tab state,gen(state)

生成州虚拟变量;

使用命令

gen t=year-62

生成时间趋势变量;

输入命令

reg lnc lnp lnpmin lny state2-state10 t

进行LSDV估计;

输入命令

est store ols

保存结果。

a36045940859c83ddc1ca697e038584c.png

然后,我们输入命令

avplot lnp

查看核心解释变量lnp与被解释变量lnc的偏相关图。

06f560f8d9ce286ed16d2da817556ef9.png

可以发现,两者之间明显呈现负相关关系。

接下来,我们检验误差项是否存在自相关、异方差和截面相关的问题。

1、自相关的检验

使用命令

xtserial lnc lnp lnpmin lny state2-state10 t

检验误差项的自相关问题。

579d2c76d3b4c4e3502cc1ce396ed421.png

由检验结果可知,P值为0,所以拒绝一阶自相关不存在的原假设,表明存在自相关问题。

2、异方差的检验

使用命令【xttest3】对误差项的异方差问题进行检验。

#【xttest3】只能在【xtreg,fe】和【xtgls】命令之后使用;

#第一次使用【xttest3】的同学,需要使用命令【ssc install xttest3】进行安装

在Stata中输入命令

quietly xtreg lnc lnp lnpmin lny t,fe

然后输入命令

xttest3

(也可以输入命令【quietly xtgls lnc lnp lnpmin lny state2-state10 t】和【xttest3】)

78c3080d011337ab0bfc1c6ac44277fb.png

由检验结果可知,P值为0,所以拒绝原假设,认为误差项存在异方差问题。

3、截面相关的检验

使用命令【xttest2】对误差项的截面相关问题进行检验。

#【xttest2】只能在【xtreg,fe】、【xtgls】或【ivreg2】之后使用,只适用于长面板数据;

#第一次使用【xttest2】的同学,需要使用命令【ssc install xttest2】进行安装

在Stata中输入命令

quietly xtreg lnc lnp lnpmin lny t,fe

然后输入命令

xttest2

(也可以输入命令【quietly xtgls lnc lnp lnpmin lny state2-state10 t】和【xttest2】)

当然,因为我们上一步进行了误差项异方差问题的检验,所以这一步我们可以直接输入命令

xttest2

0031c1e67adc90117f5bdff11a1a7863.png

可以看到,检验结果的P值为0,所以拒绝原假设,认为误差项存在截面相关的问题。

综上,通过检验,我们发现模型误差项存在自相关、异方差和截面相关的问题。

第四步 报告计量结果

通过第三步对模型误差项的检验,我们知道模型的误差项存在自相关、异方差和截面相关的问题,所以,我们需要对误差项的自相关、异方差和截面相关问题进行处理并报告计量结果。

对【xtpcse】、【xtgls】和【xtscc】三个命令的结果分别进行报告。

依次输入命令:

xtpcse lnc lnp lnpmin lny state2-state10 t,corr(psar1)
est store xtpcse
xtgls lnc lnp lnpmin lny state2-state10 t,corr(psar1) panels(correlated)
est store xtgls
xtscc lnc lnp lnpmin lny state2-state10 t
est store xtscc

最后通过【esttab】命令将所有的存储结果放在一起进行比较。

输入命令

esttab ols xtpcse xtgls xtscc,b(%9.2f)p mtitle(ols xtpcse xtgls xtscc)obslast star(* 0.1 ** 0.05 *** 0.01)compress nogap k(lnp lnpmin lny t)

fba4893dc5f5e0fd6d504594c03e6e3d.png

输出的表格中,(1)的结果是不对误差项做任何处理的结果,(2)、(3)、(4)是分别使用三种命令并对误差项的三大问题进行处理的结果。

分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:3875789
帖子:775174
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP