回归标准差和残差平方和的关系_计量学堂 | Eviews回归分析中的10个统计量解释...

论坛 期权论坛 编程之家     
选择匿名的用户   2021-5-28 02:20   11   0

1

回归分析统计量

根据矩阵的概念, 标准的回归可以写为:

25c88561cfff07817494438a56ef0af5.png

一、系数结果

(1)回归系数

最小二乘估计的系数b是由以下的公式计算得到的

508b8b17c3255fcbd13dd44a1831f1c0.png

(2)标准差标准差项列出了系数估计的标准差.估计系数的协方差矩阵是由以下公式计算得到的:

,,

4a968beeae82c1bc121eed5fb7d9516e.png

可以通过选择View/Covariance Matrix项来察看整个协方差矩阵。

(3)t-统计量

t统计量是由系数估计值和标准差之间的比率来计算,它是用来检验系数为零的假设的。

(4)概率

结果的最后一项是在误差项为正态分布或系数估计值为渐近正态分布的假设下,指出t统计量与实际观测值一致的概率。这个概率称为边际显著性水平或p值。

二、统计量总结

(1)R-squared统计量

统计量衡量在样本内预测因变量值的回归是否成功。EViews 计算的公式为:

b8e4e079d41ec22a9bd361211508fd86.png

(2)调整R-squared

使用R2作为衡量工具存在的一个问题,即在你增加新的自变量时R2不会减少。调整后的R2通常解释为消除R2中对模型没有解释力的新增变量。计算方法如下:

c761114d993ed11224cd1ce15b274cdd.png

(3)回归标准差

回归标准差是在残差的方差的估计值基础之上的一个总结。计算方法如下:

dfbe468b35daed042390e21746f0ba4b.png

(4)残差平方和

残差平方和可以用于很多统计计算中:

5981ae153597833a42fc0b10c5d61116.png

(5)对数似然函数值

对数似然计算如下:

49187fa037d403ed897b434104e0d626.png

(6)Durbin-Watson统计量

D-W 统计量衡量残差的序列相关性,计算方法如下:

224a1e287716299daed2d7e20deb717e.png

作为一个规则,如果 DW值小于2,证明存在正序列相关。

(7)因变量均值和标准差

y的均值和标准差由下面标准公式算出:

e31e5f6607c6ad8b1c7b5288b72eb133.png

(8)AIC准则 计算公式如下:

39756081940cfaad16940025271a4ea1.png

(9)Schwarz准则

Schwarz 准则是AIC准则的替代方法,它引入了对增加系数的更大的惩罚:

256a5addbee2b1576055b86479dce2f2.png

(10)F统计量和边际显著性水平

F统计量检验回归中所有的系数是否为零(除了常数或截距)。对于普通最小二乘模型,F统计量由下式计算:

735ccb69d628bba0e9d4b00572a2b4b5.png

F统计量下的P值,即Prob(F-statistic),是F检验的边际显著性水平。

2

回归分析统计量结果解释

01

回归系数

注意回归系数的正负要符合理论和实际。截距项的回归系数无论是否通过T检验都没有实际的经济意义。

02

回归系数的标准差

标准误差越大,回归系数的估计值越不可靠,这可以通过T值的计算公式可知(自查)。

03

T检验

用于检验系数是否为零。通过查表可以得到相应的临界值:如果该值大于临界值,则该系数在相应的显著水平上是可靠的;如果该值小于临界值,则系数在相应显著水平上是不显著的。

04

P值

P值为理论T值超越样本T值的概率,应该联系显著性水平α相比,α表示原假设成立的前提下,理论T值超过样本T值的概率,当P值

05

可决系数(R-squared)

表示回归的拟合程度,就是被解释变量被所有解释变量解释的部分。R方的取值范围在0到1之间:如果R方等于零,则表示该回归并不比被解释变量的简单平均数预测的更好;如果R方等于1,则表示该回归拟合的最为完美。

06

调整后的可决系数

即经自由度修正后的可决系数,从计算公式可知调整后的可决系数小于可决系数,并且可决系数可能为负,此时说明模型极不可靠。

随着解释变量的增加,R方只会增加而不会减少。为对增加的解释变量进行“惩罚”,对R方进行调整

07

回归残差的标准误

残差的经自由度修正后的标准差,OLS的实质其实就是使得均方差最小化,而均方差与此的区别就是没有经过自由度修正。

08

对数似然估计函数值

首先,理解极大似然估计法。极大似然估计法虽然没有OLS运用广泛,但它是一个具有更强理论性质的点估计方法。极大似然估计的出发点是已知被观测现象的分布,但不知道其参数。极大似然法用得到观测值(样本)最高概率(离散分布以概率聚集函数表示,连续分布以概率密度函数表示。因为要使得样本中所有样本点都出现,假定抽样是随机的则各个样本点的是独立同分布的,所以最后总的概率表现为概率聚集函数或者概率密度函数的连乘形式,称之为似然函数。要取最大概率,即将似然函数对未知参数求导令导数等于0即可获得极大似然函数。一般为简化函数的处理过程都会对似然函数进行对数化处理,这样最后得到的极大似然函数就称之为对数极大似然函数)的那些参数的值来估计该分布的参数,从而提供一种用于估计刻画一个分布的一组参数的方法。

其次,理解对数似然估计函数值。对数似然估计函数值一般取负值,实际值(不是绝对值)越大越好。第一,基本推理。对于似然函数,如果是离散分布,最后得到的数值直接就是概率,取值区间为0-1,对数化之后的值就是负数了;如果是连续变量,因为概率密度函数的取值区间并不局限于0-1,所以最后得到的似然函数值不是概率而只是概率密度函数值,这样对数化之后的正负就不确定了。第二,Eviews的计算公式解释。公式值的大小关键取之于残差平方和(以及样本容量),只有当残差平方和与样本容量的比之很小时,括号内的值才可能为负,从而公式值为正,这时说明参数拟合效度很高;反之公式值为负,但其绝对值越小表示残差平方和越小,因而参数拟合效度越高。

09

DW检验值

DW统计量用于检验序列的自相关,公式就是测度残差序列与残差的滞后一期序列之间的差异大小,经过推导可以得出DW值与两者相关系数的等式关系,因而很容易判断。DW值的取值区间为0-4,当DW值很小时(大致<1)表明序列可能存在正自相关;当DW值很大时(大致>3)表明序列可能存在负自相关;当DW值在2附近时(大致在1.5到2.5之间)表明序列无自相关;其余的取值区间表明无法确定序列是否存在自相关。当然,DW具体的临界值还需要根据样本容量和解释变量的个数通过查表来确定。

DW值并不是一个很适用的检验手段,因为它存在苛刻的假设条件:解释变量为非随机的;随机扰动项为一阶自回归形式;解释变量不能包含滞后的被解释变量;必须有截距项;数据无缺失值。当然,可以通过DW-h检验来检验包含滞后被解释变量作为解释变量的序列是否存在自相关。h统计量与滞后被解释变量的回归系数的方差呈正相关关系,可以消除其影响。

10

被解释变量的样本均值

被解释变量的样本均值(MeanDependent Var)

11

被解释变量的样本标准误差

被解释变量的样本标准误差(S.D.Dependent Var)

12

赤池信息准则(AIC)

AIC和SC在时间序列分析过程中的滞后阶数确定过程中非常重要,一般是越小越好。

一般理解:根据AIC的计算公式(-2*L/N+2*k/N,L为对数似然估计函数值,k为滞后阶数,N为样本容量)可知:当滞后阶数小时,2*k/N小,但因为模型的模拟效果会比较差所以L(负值)会比较小,加上负号之后则变得较大,因此最后的AIC有可能较大;当滞后阶数大时,模型的模拟效果会比较好所以L(负值)会比较大,加上负号之后则变得较小,但是2*k/N过大(损失自由度的代价),因此最后的AIC也有可能较大。综上,AIC较小意味着滞后阶数较为合适。

13

施瓦茨信息准则(SC)

与AIC没有任何本质区别,只是加入样本容量的对数值以修正损失自由度的代价。

14

F统计量(F-statistic)

F统计量考量的是所有解释变量整体的显著性,所以F检验通过并不代表每个解释变量的t值都通过检验。当然,对于一元线性回归,T检验与F检验是等价的。

15

prob(F-statistic)

F统计量的P值,一切的P值都是同样的实质意义。

3

回归模型残差检验

回归模型估计完毕后,通常研究者会对模型估计的残差进行检验,通过回归残差的性质来判断模型估计的效果。常用的检验有:Q检验和LM检验用来判断残差是否违背无相关假定、异方差检验用来判断残差是否违背同方差假定、正态性检验用于判断残差的分布。检验的一般程序(适用于绝大部分统计量检验)是计算相关统计量的原假设成立的概率P值,如果该概率P值小于某个设定显著水平(通常为5%),则拒绝原假设,认为备择假设成立;反之,则不能拒绝原假设。

残差自相关的Q检验:

检验目的:Q统计量的全称是Ljung-Box Q,该统计量一般用于检验序列是否存在自相关。检验假设:该统计量的原假设H0为:残差序列不存在自相关;备择假设H1为:残差序列存在自相关。

残差自相关的LM检验:

LM检验是Breush-Godfrey Lagrange Multiplier的简称,主要用于检验残差序列是否存在高阶自相关的重要假设。该统计量的计算首先必须利用OLS估计出原模型的残差序列u;然后以u为被解释变量,以u的1到P阶滞后项为解释变量再次进行回归,同时记录该回归的拟合优度R方。LM检验统计量的原假设为H0为:残差序列直到P阶不存在自相关;备择假设H1为:残差序列P阶内存在自相关。

残差的正态性检验:

检验目的:Histogram-Normality Test检验主要是通过计算JB统计量实现的,JB统计量用来检验序列观测值是否服从正态分布,在零假设下,JB统计量服从χ2(2)分布。检验假设:该检验的原假设H0为:样本残差服从正态分布。备择假设H1为:残差序列不服从正态分布。

残差的异方差检验:

检验目的:由于最小二乘方法是建立在残差同方差假设基础上的,一旦出现异方差就说明OLS方法就不可靠了,需要利用加权最小二乘方法进行纠正。异方差检验是利用辅助回归的方法进行的,该统计量服从卡方分布。检验假设:怀特异方差检验的原假设H0为:残差序列不存在异方差。备择假设H1为:残差序列存在异方差。

来源:计量经济学服务中心


09f9a89ec717baf925e2c784346cdaab.gif

●计量学堂 | 一文读懂案例研究方法与扎根理论

●计量学堂 | T检验与F检验详析

●计量学堂 | 事件研究法,附程序code和解释

●计量学堂 | 如何写好计量实证论文?

●计量学堂 | 内生性与工具变量的9个基本问题

●计量学堂 | 统计学常识

●计量学堂 | 微观经济数据库汇总(CGSS、CSS、CLDS、CHIP、CFPS、CHARLS、CHFS、CLHLS、CHNS)

●计量学堂 | 原始数据网站大全!200个国内外经济/金融/行研/咨询数据网站

●计量学堂 | 中国15个大型微观数据库汇总

●计量学堂 | 超强文献管理软件,EndNote使用介绍

●计量学堂 | 寻找工具变量

●做描述性统计时,报告缩尾前的结果,还是缩尾后的?(附stata winsorize代码)

分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:3875789
帖子:775174
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP