![3b38dbb5e5a76ec2bc937d87d54ce002.png](https://img-
blog.csdnimg.cn/img_convert/3b38dbb5e5a76ec2bc937d87d54ce002.png)
文章首发于公众号 “如风起”。
原文链接:
小白学统计|面板数据分析与Stata应用笔记(三)mp.weixin.qq.com
![cfc1da8c12a7753505fcd5700772ac89.png](https://img-
blog.csdnimg.cn/img_convert/cfc1da8c12a7753505fcd5700772ac89.png)
面板数据分析与Stata应用笔记整理自慕课上浙江大学方红生教授的面板数据分析与Stata应用课程,笔记中部分图片来自课程截图。
笔记内容还参考了陈强教授的《高级计量经济学及Stata应用(第二版)》
长面板数据分析
上两篇笔记我们讲到了短面板数据分析。短面板数据分析主要关注对不可观测的个体效应的处理,而对于误差自相关、异方差和截面相关的问题只提供经过校正的标准误。
与短面板数据不同,长面板数据分析主要关注对误差项的处理(因为时间T大),而将个体效应用虚拟变量来控制(因为个体n小)。
所以,对于长面板数据分析,我们不需要在固定效应模型、随机效应模型和混合回归模型之间进行选择,长面板数据分析先验假定长面板数据模型就是固定效应模型。
此外,需要注意的是,短面板数据分析对于时间效应,用虚拟变量来控制,而长面板数据分析,由于时间T相对较长,为避免损失较多的*度,所以一般则用时间趋势项来控制。
可以认为长面板数据模型是一个特殊的双向固定效应模型。在这个模型中,个体效应用虚拟变量控制,时间效应用时间趋势项控制,长面板数据模型的估计主要关注对误差项的处理。
一、长面板数据模型的估计方法
通常有三种方法对长面板数据模型进行估计。
第一种:
使用OLS估计这个特殊的双向固定效应模型,并对误差项的自相关、异方差和截面相关的问题只提供面板校正的标准误(使用命令xtscc或xtpcse命令实现),这种估计方法最为稳健。
第二种:
如果存在自相关、异方差和截面相关的问题,则使用FGLS估计这个特殊的双向固定效应模型,这种方法只是解决了误差项自相关的问题,而并未考虑异方差或截面相关的问题,对于误差项的异方差和截面相关的问题仍然只是提供面板校正的标准误(使用命令xtpcse实现),这种估计方法介于稳健和效率之间。
第三种:
使用FGLS估计这个特殊的双向固定效应模型,对误差项的自相关、异方差和截面相关的问题一并加以处理(使用命令xtgls实现),这种估计方法最有效率。
二、长面板数据模型的Stata估计命令
常用的估计长面板数据模型的Stata命令有三个:【xtpcse】、【xtgls】和【xtscc】
对于【xtscc】命令,我们在前两篇短面板数据的笔记中已经讲过,【xtscc】也适用于长面板数据分析,它可以实现长面板数据模型的第一种估计方法,对误差项的自相关、异方差和截面相关问题提供面板校正的标准误。
下面,我们讲一下【xtpcse】和【xtgls】估计命令
1、【xtpcse】命令
基本命令格式:
xtpcse depvar indepvars,options
[/code]
#命令的关键在于选项(options),不同的选项可以处理不同的问题。
**对于误差项三大问题【xtpcse】命令选项(options)的使用**
**(1)自相关问题(一阶自相关)**
a.使用选项:corr(ar1),使用的估计方法为FGLS
#误差项存在自相关时使用该选项;当T不比n大很多时使用该选项,因为此时T可能无法提供足够多的信息去估计每个个体的自相关系数,所以约束了每个个体的自相关系数都相等
b.使用选项:corr(psar1),使用的估计方法为FGLS。
#误差项存在自相关时使用该选项;当T比n大很多时使用该选择项,当T比n大很多时每个个体的自相关系数可以不同,就可以使用选项
c.使用选项:corr(independent)或corr(ind),使用的估计方法为OLS。
#误差项不存在自相关时,使用该选项
**(2)异方差与截面相关问题**
a.使用选项:independent
#误差项不存在异方差和截面相关问题,使用该选项
b.使用选项:hetonly(提供考虑异方差的面板校正标准误)
#误差项存在异方差但不存在截面相关问题,则使用该选项
c.使用选项:不加选项即可(提供既考虑异方差又考虑截面相关的面板校正标准误)
#误差项存在异方差和截面相关问题时,不加任何选项
选项:corr(ind)+independent等价于LSDV
**2、【xtgls】命令**
基本命令格式:
```code
xtgls depvar indepvars,options
[/code]
#如果对误差项的处理正确,那么【xtgls】比x【tpcse】估计效果更好
**对于误差项三大问题【xtgls】命令选项(options)的使用**
**(1)自相关问题(一阶自相关)**
【xtgls】与【xtpcse】命令的选项对自相关问题的处理是相同的
a.使用选项:corr(ar1),使用的估计方法为FGLS
#误差项存在自相关时使用该选项;当T不比n大很多时使用该选项,因为此时T可能无法提供足够多的信息去估计每个个体的自相关系数,所以约束了每个个体的自相关系数都相等
b.使用选项:corr(psar1),使用的估计方法为FGLS。
#误差项存在自相关时使用该选项;当T比n大很多时使用该选择项,当T比n大很多时每个个体的自相关系数可以不同,就可以使用选项
c.使用选项:corr(independent)或corr(ind),使用的估计方法为OLS。
#误差项不存在自相关时,使用该选项
**(2)异方差与截面相关问题**
a.使用选项:panels(iid)
#误差项不存在异方差和截面相关,使用该选项
b.使用选项:panles(heteroskedastic)
#误差项存在异方差但不存在截面相关问题时,使用该选项
c.使用选项:panels(correlated)#只适用于长面板数据
#误差项存在异方差和截面相关问题时,使用该选项
选项:corr(ind)+panels(iid)等价于LSDV
**三、长面板数据分析的实例操作**
#以数据集“mus08cigar.dta”为例估计香烟需求函数,数据来源于慕课上浙江大学方红生教授的面板数据分析与Stata应用课程中。
“mus08cigar.dta”数据集包括了美国10个州1963-1992年有关香烟消费量的相关变量。
参考上一篇文章短面板数据分析的基本程序,我们对长面板数据进行分析。
**第一步 模型设定与数据**
长面板数据不需要进行模型的选择,我们构造一个双向固定效应模型
![]()
其中,被解释变量lnc为人均香烟消费量的对数,解释变量:lnp为实际香烟价格的对数,lnpmin为相邻州最低香烟价格的对数,lny为人均可支配收入的对数。
**在Stata软件中对数据进行分析,执行如下步骤:**
**1、导入数据到Stata中**
在Stata的“命令窗口”中输入命令
```code
use"数据集路径mus08cigar.dta"
[/code]
将“traffic.dta”数据集导入到Stata中,
例如
```code
use"C:Usersmus08cigar.dta"
[/code]
将数据导入Stata后,即可在Stata的“变量窗口”中看到“mus08cigar”数据集中的各个变量的名称及其标签。
![384c8263a3a4d1c827c2493c943f915e.png](https://img-
blog.csdnimg.cn/img_convert/384c8263a3a4d1c827c2493c943f915e.png)
**2、查看数据**
在Stata的“命令窗口”输入命令
```code
des
[/code]
和命令
```code
xtdes
[/code]
查看“mus08cigar”数据集。
![e6f11e58c0b8015de35e61c27d4862f1.png](https://img-
blog.csdnimg.cn/img_convert/e6f11e58c0b8015de35e61c27d4862f1.png)
![7ecd685c5b5c1bf94a2b6237b5b9ca4b.png](https://img-
blog.csdnimg.cn/img_convert/7ecd685c5b5c1bf94a2b6237b5b9ca4b.png)
从输出结果我们可以看到:“mus08cigar”数据集包含300个观测值,6个变量。
面板数据的截面数 ,时间数 , ,说明这是一个长面板数据集。
输入命令
```code
xtset state year
[/code]
告诉Stata软件,这是一个以截面变量state为州,时间变量为year的面板数据。
![bb9f451d371776489ab47bf647f39b77.png](https://img-
blog.csdnimg.cn/img_convert/bb9f451d371776489ab47bf647f39b77.png)
由“strongly balance”可知,这是一个平衡面板数据。
至此,我们可以知道,“mus08cigar”数据集是一个10个州,1963-1992年的长面板数据集且为平衡面板数据集。
**第二步 描述性统计作图**
**1、描述性统计**
**使用命令【sum 关键变量】可以得到关键变量的描述性统计表。**
在Stata中输入命令
```code
sum lnc lnp lnpmin lny
[/code]
得到解释变量与被解释变量的观测值、均值、标准差、最小值和最大值。
![6875e7c437667ae2c0bcfcf68d469caf.png](https://img-
blog.csdnimg.cn/img_convert/6875e7c437667ae2c0bcfcf68d469caf.png)
**2、绘制散点图及回归直线**
**在回归之前,我们先画出核心变量lnp与被解释变量lnc的散点图及回归直线,来预先观测一下核心变量与被解释变量之间是否存在理论上预期的负相关系。**
使用命令
```code
twoway(scatter lnc lnp)(lfit lnc lnp)
[/code]
画出核心变量“lnp”与被解释变量“lnc”的散点图及回归直线。
![d536cfd8b4178da32a44e1447ecce8d0.png](https://img-
blog.csdnimg.cn/img_convert/d536cfd8b4178da32a44e1447ecce8d0.png)
由结果可知,lnp与lnc之间是负相关系的,与理论预期一致。
接下来,我们做出相邻州的香烟价格的对数与被解释变量的散点图及回归直线,看一下核心变量lnpmin与被解释变量lnc之间是否存在理论上预期的正相关系。使用命令
```code
twoway(scatter lnc lnpmin)(lfit lnc lnpmin)
[/code]
![e670a42a9f15b20737742577eda306c1.png](https://img-
blog.csdnimg.cn/img_convert/e670a42a9f15b20737742577eda306c1.png)
由结果可知,相邻州的香烟价格的对数lnpmin与被解释变量lnc之间是正相关系的,这与我们的理论预期并不符合。
不过,因为我们并没有控制其他的影响因素,所以这个结果并不是完全正确的,在之后的操作中,我们可以使用命令【avplot】绘制变量之间的偏相关图。
**3、绘制核心变量的时间序列图**
使用命令
```code
xtline lnc
[/code]
做出核心变量人均香烟消费的对数lnc在各个州的时间序列图,以研究分析人均香烟消费的对数lnc在每个州中的变动趋势。
![fa82d23c0703caa532d36d7d7b0706a6.png](https://img-
blog.csdnimg.cn/img_convert/fa82d23c0703caa532d36d7d7b0706a6.png)
观察lnc在各个州的时序图,我们可以发现,1980年之后,所有州的人均香烟消费率基本都呈现出下降趋势。
使用命令
```code
xtline lnp
[/code]
做出美国10个州1963-1992年实际香烟价格对数的时间序列图。
![0cf3632edddad6af795b86015afe87d9.png](https://img-
blog.csdnimg.cn/img_convert/0cf3632edddad6af795b86015afe87d9.png)
观察发现:1980年之后,所有州的香烟价格基本都呈现了上升的趋势。
**第三步 模型估计**
**首先** ,我们先假定不存在自相关、异方差和截面相关这三大问题,使用LSDV估计双向固定效应模型。
依次进行如下操作:
使用命令
```code
tab state,gen(state)
[/code]
生成州虚拟变量;
使用命令
```code
gen t=year-62
[/code]
生成时间趋势变量;
输入命令
```code
reg lnc lnp lnpmin lny state2-state10 t
[/code]
进行LSDV估计;
输入命令
```code
est store ols
[/code]
保存结果。
![a36045940859c83ddc1ca697e038584c.png](https://img-
blog.csdnimg.cn/img_convert/a36045940859c83ddc1ca697e038584c.png)
然后,我们输入命令
```code
avplot lnp
[/code]
查看核心解释变量lnp与被解释变量lnc的偏相关图。
![06f560f8d9ce286ed16d2da817556ef9.png](https://img-
blog.csdnimg.cn/img_convert/06f560f8d9ce286ed16d2da817556ef9.png)
可以发现,两者之间明显呈现负相关关系。
**接下来** ,我们检验误差项是否存在自相关、异方差和截面相关的问题。
**1、自相关的检验**
使用命令
```code
xtserial lnc lnp lnpmin lny state2-state10 t
[/code]
检验误差项的自相关问题。
![579d2c76d3b4c4e3502cc1ce396ed421.png](https://img-
blog.csdnimg.cn/img_convert/579d2c76d3b4c4e3502cc1ce396ed421.png)
由检验结果可知,P值为0,所以拒绝一阶自相关不存在的原假设,表明存在自相关问题。
**2、异方差的检验**
使用命令【xttest3】对误差项的异方差问题进行检验。
#【xttest3】只能在【xtreg,fe】和【xtgls】命令之后使用;
#第一次使用【xttest3】的同学,需要使用命令【ssc install xttest3】进行安装
在Stata中输入命令
```code
quietly xtreg lnc lnp lnpmin lny t,fe
[/code]
然后输入命令
```code
xttest3
[/code]
(也可以输入命令【quietly xtgls lnc lnp lnpmin lny state2-state10 t】和【xttest3】)
![78c3080d011337ab0bfc1c6ac44277fb.png](https://img-
blog.csdnimg.cn/img_convert/78c3080d011337ab0bfc1c6ac44277fb.png)
由检验结果可知,P值为0,所以拒绝原假设,认为误差项存在异方差问题。
**3、截面相关的检验**
使用命令【xttest2】对误差项的截面相关问题进行检验。
#【xttest2】只能在【xtreg,fe】、【xtgls】或【ivreg2】之后使用,只适用于长面板数据;
#第一次使用【xttest2】的同学,需要使用命令【ssc install xttest2】进行安装
在Stata中输入命令
```code
quietly xtreg lnc lnp lnpmin lny t,fe
[/code]
然后输入命令
```code
xttest2
[/code]
(也可以输入命令【quietly xtgls lnc lnp lnpmin lny state2-state10 t】和【xttest2】)
当然,因为我们上一步进行了误差项异方差问题的检验,所以这一步我们可以直接输入命令
```code
xttest2
[/code]
![0031c1e67adc90117f5bdff11a1a7863.png](https://img-
blog.csdnimg.cn/img_convert/0031c1e67adc90117f5bdff11a1a7863.png)
可以看到,检验结果的P值为0,所以拒绝原假设,认为误差项存在截面相关的问题。
综上,通过检验,我们发现模型误差项存在自相关、异方差和截面相关的问题。
**第四步 报告计量结果**
通过第三步对模型误差项的检验,我们知道模型的误差项存在自相关、异方差和截面相关的问题,所以,我们需要对误差项的自相关、异方差和截面相关问题进行处理并报告计量结果。
对【xtpcse】、【xtgls】和【xtscc】三个命令的结果分别进行报告。
**依次输入命令:**
```code
xtpcse lnc lnp lnpmin lny state2-state10 t,corr(psar1)
est store xtpcse
xtgls lnc lnp lnpmin lny state2-state10 t,corr(psar1) panels(correlated)
est store xtgls
xtscc lnc lnp lnpmin lny state2-state10 t
est store xtscc
[/code]
最后通过【esttab】命令将所有的存储结果放在一起进行比较。
输入命令
```code
esttab ols xtpcse xtgls xtscc,b(%9.2f)p mtitle(ols xtpcse xtgls xtscc)obslast star(* 0.1 ** 0.05 *** 0.01)compress nogap k(lnp lnpmin lny t)
[/code]
![fba4893dc5f5e0fd6d504594c03e6e3d.png](https://img-
blog.csdnimg.cn/img_convert/fba4893dc5f5e0fd6d504594c03e6e3d.png)
输出的表格中,(1)的结果是不对误差项做任何处理的结果,(2)、(3)、(4)是分别使用三种命令并对误差项的三大问题进行处理的结果。
![在这里插入图片描述](https://img-blog.csdnimg.cn/20210608151750993.gif)