长面板的估计
由于短面板的时间维度小,无法进行自相关分析,在长面板之下,我们拥有较长的时间维度,这为分析自相关提供了大量的时间信息。
午饭过后接下来步入正题。
异方差种类
模型:
y
i
t
=
x
i
t
′
β
+
ε
i
t
y_{it}=x_{it}' \beta +\varepsilon_{it}
yit=xit′β+εit
- 组间异方差 σ i 2 = v a r ( ε i t ) , σ i 2 ≠ σ j 2 , ( i ≠ j ) \sigma^2_i = var(\varepsilon_{it}), \sigma^2_i \neq \sigma^2_j, (i \neq j) σi2=var(εit),σi2=σj2,(i=j)
- 组内自相关 c o v ( ε i t , ε i s ) ≠ 0 , ( t ≠ s , ∀ i ) cov(\varepsilon_{it},\varepsilon_{is}) \neq 0,(t \neq s , \forall i) cov(εit,εis)=0,(t=s,∀i)
- 组间同期相关,也称空间相关 c o v ( ε i t , ε j t ) ≠ 0 , ( i ≠ j , ∀ t ) cov(\varepsilon_{it},\varepsilon_{jt}) \neq 0,(i \neq j,\forall t) cov(εit,εjt)=0,(i=j,∀t)
有两种方式进行处理异方差:
- 仍然使用OLS进行估计,然后进行标准误差矫正
- 对异方差或自相关的具体形式进行假设,然后使用可行广义最小二乘法进行估计。
面板矫正标准误
扰动误差项存在组间异方差或组间同期相关,ols的估计量也是一致的。此时只需要使用‘组间异方差,组间同期相关’的稳健标准误。即面板矫正标准误。
尝试使用hetonly命令,存在组间异方差,但不存在组间同期相关。(非面板矫正标准误)
上表显示:
有些州虚拟变量很显著,而 时间不显著,因此可以考虑让一些州拥有不同的截距水平。
但是上表未考虑组间异方差与组间同期相关。因此使用面板矫正标准误:
此时面板矫正标准误变小了。
仅解决组内自相关的FGLS
假设扰动项
ε
i
,
t
=
ρ
i
ε
i
,
t
−
1
+
v
i
,
t
\varepsilon_{i,t} = \rho_i \varepsilon_{i,t-1}+v_{i,t}
εi,t=ρiεi,t−1+vi,t
其中,认为
∣
ρ
i
∣
<
1
,
v
i
t
为
独
立
同
分
布
且
期
望
为
0
,
如
果
ρ
i
=
ρ
则
所
有
个
体
都
服
从
自
回
归
系
数
相
同
A
R
(
1
)
\lvert \rho_i \rvert<1,v_{it}为独立同分布且期望为0,如果\rho_i = \rho 则所有个体都服从自回归系数相同AR(1)
∣ρi∣<1,vit为独立同分布且期望为0,如果ρi=ρ则所有个体都服从自回归系数相同AR(1),此时使用Prais-Winsten估计法对原模型进行广义差分变换,就得到FGLS估计量。
偷个懒,截图了
下面考虑允许各组自回归系数不同的组内自相关情形
第三个州由于标准误过于接近于0,所以被删除。
可以对比得知,AR1与PSAR1的估计大致相同,与OLS估计量不同,因此决定使用OLS还是AR1估计,还需要对组内自相关进行检验。
全面FGLS
虽然xtpsce提供了组间异方差与同期相关稳健的面板校正标准误,但在进行FGLS估计时仅针对组内自相关,并未考虑组间异方差或同期相关。全面的FGLS需要同时这三个因素,组间异方差,同期相关,组内自相关。
因此可以先对
y
i
t
=
x
i
t
′
β
+
ε
i
t
y_{it}=x_{it}' \beta +\varepsilon_{it}
yit=xit′β+εit进行OLS估计,使用估计的残差进行估计
ε
\varepsilon
ε的协方差矩阵 以此进行FGLS估计;还可以通过FGLS进行迭代估计,再使用FGLS的估计残差再进行FGLS估计,直至收敛。
1.考虑同时存在组间异方差、同期相关以及组内自相关(自相关系数相同)
2.考虑各组自回归系数不同
总结:
各种FGLS估计量都有不同,究竟使用那种估计量,取决于对组间异方差、组内自相关的、组间同期相关的检验。OLS+面板校正标准误最稳定,全面的FGLS估计最有效率,仅解决组内自相关的FGLS介于二者之间。
组间异方差检验、组内自相关检验、组间同期相关检验
组间异方差检验
组内自相关检验
组间同期相关检验
偷懒截图ing
变系数模型
对于长面板数据,不仅可以让个体方程拥有不同的截距和时间趋势项,也可以让个体方程的斜率不同。
区分为:系数常数的模型和系数随机的模型(随机系数模型)
系数为常数的模型
- 通常对每个个体分别回归,但是如果不同个体的扰动项相关,会忽略不同方程扰动项相关的信息,导致效率不高
- 最有效率的做法是:把所有个体回归方程叠放,然后使用似不相关回归对整个系统进行系统估计。缺点是:需要估计较多的参数导致*度减少。
- 折中,将研究者认为会变动的系数设为变动,其余设为常数。
其中,i.state是虚拟变量,i.state#c.lny是两个的互动项,并且c表示连续。
随机系数模型
上表的最后一列的P值为0.0000,拒绝原假设(系数不变),因此需要采用变系数模型。
面板工具变量法
虽然面板数据能解决一定的遗漏变量问题,但是却解决不了内生解释变量问题,因此我们仍然需要采取工具变量法对面板数据处理,解决内生性问题。
-
对固定效应模型先离差变换再工具变量法
-
对固定效应模型先进行一阶差分变换再工具变量法
-
对随机效应模型使用工具变量法
-
面板工具变量法的过度识别检验
豪斯曼-泰勒估计量
针对一些变量的内生性问题,我们采用变量值减去变量在时间维度的均值作为工具变量。
前提是所有解释变量均与
ε
i
,
t
\varepsilon_{i,t}
εi,t不相关,而且部分解释变量与
u
i
u_i
ui不相关。