【计量经济学】联立方程模型
考虑如下劳动供给方程,hhh表示农业工人提供的年劳动小时数,www表示这类工人的平均小时工资hs=α1w+β1z1+u1(1)h_s = \alpha_1 w + \beta_1 z_1 + u_1 \qquad (1)hs=α1w+β1z1+u1(1)其中,z1z_1z1为某个可以影响劳动供给的可观测变量,如本县制造业的平均工资;根据不同的(小时,工资)可以画出供给曲线,如果z,uz
联立方程模型 – 潘登同学的计量经济学笔记
文章目录
IV估计法与2SLS解决了两种内生性的问题–遗漏变量和测量误差问题,而联立方程模型则是解决联立性问题,就是互相决定问题(如:供求模型,价格与数量互相决定),而估计联立方程模型的估计方法还是工具变量法;
联立方程模型(SEM)
考虑如下劳动供给方程,
h
h
h表示农业工人提供的年劳动小时数,
w
w
w表示这类工人的平均小时工资
h
s
=
α
1
w
+
β
1
z
1
+
u
1
(
1
)
h_s = \alpha_1 w + \beta_1 z_1 + u_1 \qquad (1)
hs=α1w+β1z1+u1(1)
其中,
z
1
z_1
z1为某个可以影响劳动供给的可观测变量,如本县制造业的平均工资;
- 上式称为结构方程,之所以这样叫是因为劳动供给函数可以从经济理论中推导出来并能够进行因果解释。
- 系数 α \alpha α度量了劳动供给如何随工资的变化而变化,如果变;量都是对数形式,则表示劳动供给弹性,一般预期为正;
- 系数 β \beta β预期为负,因为制造业的工资对于农业工人来说可以理解为机会成本;
根据不同的(小时,工资)可以画出供给曲线,如果 z , u z,u z,u会变化,那么曲线会移动,每个 ( z , u ) (z,u) (z,u)对应一条曲线,
注意: 我们收集到的数据,都是在劳动力市场出清的条件下,观测到了均衡工资水平和工作小时数;
所以我们要引入劳动力的需求函数
h
d
=
α
2
w
+
β
2
z
2
+
u
2
(
2
)
h_d = \alpha_2 w + \beta_2 z_2 + u_2 \qquad (2)
hd=α2w+β2z2+u2(2)
其中,
z
2
z_2
z2是可观测的需求移动因子,可以是农地面积,因为农地越多需要的工人越多;
- 上式也称为结构方程, α \alpha α的符号预期为负, β \beta β的符号预期为正;
注意:
- 方程 ( 1 ) (1) (1)劳动力供给方程是农业工人的一个行为方程;
- 方程 ( 2 ) (2) (2)劳动力需求方程是农场主的一个行为方程;
而在每一个城市中,所观测到的小时数
h
i
h_i
hi和所观测到的工资水平
w
i
w_i
wi由下式的均衡条件
h
i
s
=
h
+
i
d
h_{is} = h+{id}
his=h+id
将
(
1
)
,
(
2
)
(1),(2)
(1),(2)联立
{
h
i
=
α
1
w
i
+
β
1
z
i
1
+
u
i
1
h
i
=
α
2
w
i
+
β
2
z
i
2
+
u
i
2
\begin{cases} h_i = \alpha_1 w_i + \beta_1 z_{i1} + u_{i1} \\ h_i = \alpha_2 w_i + \beta_2 z_{i2} + u_{i2} \\ \end{cases}
{hi=α1wi+β1zi1+ui1hi=α2wi+β2zi2+ui2
这就是一个SEM(联立方程模型)
- 给定 z i 1 、 z i 2 、 u i 1 、 u i 2 z_{i1}、z_{i2}、u_{i1}、u_{i2} zi1、zi2、ui1、ui2那么方程就决定了一个 h i 、 w i h_i、w_i hi、wi
- h i 、 w i h_i、w_i hi、wi是这个SEM的内生变量,而 z i 1 、 z i 2 z_{i1}、z_{i2} zi1、zi2是外生变量
- z i 1 、 z i 2 z_{i1}、z_{i2} zi1、zi2与误差无关,而误差称为结构误差
- 如果方程中没有 z i 1 、 z i 2 z_{i1}、z_{i2} zi1、zi2,就无法辨别哪个是供给方程哪个是需求方程
一个合适的列子
一个不合适的例子
联立性偏误
当解释变量与因变量被联立决定时,它通常与误差项相关,这就导致OLS估计中存在偏误和不一致性
y
1
=
α
1
y
2
+
β
1
z
1
+
u
1
y
2
=
α
2
y
1
+
β
2
z
2
+
u
2
y_1 = \alpha_1 y_2 + \beta_1 z_1 + u_1 \\ y_2 = \alpha_2 y_1 + \beta_2 z_2 + u_2 \\
y1=α1y2+β1z1+u1y2=α2y1+β2z2+u2
我们重点关注第一个方程,这是待估方程;为了证明
y
2
与
u
1
y_2与u_1
y2与u1相关,将上式带入下式
(
1
−
α
1
α
2
)
y
2
=
α
2
β
1
z
1
+
β
2
z
2
+
α
2
u
1
+
u
2
(
∗
)
(1-\alpha_1 \alpha_2)y_2 = \alpha_2 \beta_1 z_1 + \beta_2 z_2 + \alpha_2 u_1 + u_2 \qquad (*)
(1−α1α2)y2=α2β1z1+β2z2+α2u1+u2(∗)
为了能得出
y
2
y_2
y2,我们必须假设
α
1
α
2
≠
1
\alpha_1 \alpha_2 \neq 1
α1α2=1
进而将上式化简
y
2
=
π
21
z
1
+
π
22
z
2
+
v
2
y_2 = \pi_{21} z_1 + \pi_{22}z_2 + v_2
y2=π21z1+π22z2+v2
{
π
21
=
α
2
β
1
1
−
α
2
α
1
π
22
=
β
2
1
−
α
2
α
1
v
2
=
α
2
u
1
+
u
2
1
−
α
2
α
1
\begin{cases} \pi_{21}=\frac{\alpha_2\beta_1}{1-\alpha_2\alpha_1} \\ \pi_{22}=\frac{\beta_2}{1-\alpha_2\alpha_1} \\ v_{2}=\frac{\alpha_2u_1 + u_2}{1-\alpha_2\alpha_1} \\ \end{cases}
⎩⎪⎨⎪⎧π21=1−α2α1α2β1π22=1−α2α1β2v2=1−α2α1α2u1+u2
用外生变量和误差项表示
y
2
y_2
y2的方程,成为约简型方程;
π
21
和
π
22
\pi_{21}和\pi_{22}
π21和π22被称为约简型参数;
- 上式中, v 2 v_2 v2是结构型误差 u 1 和 u 2 u_1和u_2 u1和u2的线性函数,其与 z 1 和 z 2 z_1和z_2 z1和z2都无关,所以可以用OLS一致地估计 π 21 和 π 22 \pi_{21}和\pi_{22} π21和π22
- 回到 ( ∗ ) (*) (∗)式,除非 α 2 = 0 \alpha_2=0 α2=0, 否则 y 2 与 u 1 y_2与u_1 y2与u1就相关;而如果 α 2 = 0 \alpha_2=0 α2=0,那么 y 1 , y 2 y_1,y_2 y1,y2就不是互相决定的,没必要用联立方程模型,直接OLS估计即可;
- 当 y 2 与 u 1 y_2与u_1 y2与u1因联立而相关时,我们就说OLS法存在联立性偏误
结构方程的识别与估计
考虑如下方程
{
q
=
α
1
p
+
β
1
z
1
+
u
1
(
3
)
q
=
α
2
p
+
u
2
(
4
)
\begin{cases} q = \alpha_1 p + \beta_1 z_1 + u_1 \qquad (3)\\ q = \alpha_2 p + u_2 \qquad (4) \\ \end{cases}
{q=α1p+β1z1+u1(3)q=α2p+u2(4)
其中,
q
q
q表示县级水平的人均牛奶消费量,
p
p
p表示该县牛奶的平均价格,
z
1
z_1
z1表示牛饲料的价格,并假定其外生与牛奶的供给与需求;
- 很显然 ( 3 ) (3) (3)是需求方程,因为牛饲料的价格会影响供给而不会直接影响需求;
- 给定 ( q , p , z 1 ) (q,p,z_1) (q,p,z1)的一组样本,而我们可以估计的方程是 ( 4 ) (4) (4),又称 ( 4 ) (4) (4)为可识别方程,因为根据IV估计法, z 1 z_1 z1影响供给方程而不影响需求方程,所以 z 1 z_1 z1可以作为 ( 4 ) (4) (4)中的一个工具变量;
考虑一般情况
{
y
1
=
β
10
+
α
1
y
2
+
Z
1
β
1
+
u
1
(
5
)
y
2
=
β
20
+
α
2
y
1
+
Z
2
β
2
+
u
2
(
6
)
\begin{cases} y_1 = \beta_{10} + \alpha_1 y_2 + Z_1\beta_1 + u_1 \qquad (5) \\ y_2 = \beta_{20} + \alpha_2 y_1 + Z_2\beta_2 + u_2 \qquad (6) \\ \end{cases}
{y1=β10+α1y2+Z1β1+u1(5)y2=β20+α2y1+Z2β2+u2(6)
- y 1 , y 2 y_1,y_2 y1,y2是内生变量,而 u 1 , u 2 u_1,u_2 u1,u2是结构误差项, β 10 , β 20 \beta_{10},\beta_{20} β10,β20是截距项, Z 1 , Z 2 Z_1,Z_2 Z1,Z2分别表示 k 1 , k 2 k_1,k_2 k1,k2个外生变量的集合, Z 1 = { z 11 , . . . , z 1 k 1 } Z_1 = \{z_{11},...,z_{1k_1}\} Z1={z11,...,z1k1},而 β 1 , β 2 \beta_1,\beta_2 β1,β2则是与 Z 1 , Z 2 Z_1,Z_2 Z1,Z2对应的系数;
- Z 1 , Z 2 Z_1,Z_2 Z1,Z2一般都包含着不同外生变量的事实意味着,我们对模型施加了排除性约束,有一些外生变量只会出现在第一个式子中,有一些只会出现在第二个式子中,这样我们就能区分两个结构方程;
- 当满足假设 α 1 α 2 ≠ 1 \alpha_1\alpha_2\neq 1 α1α2=1时, y 1 , y 2 y_1,y_2 y1,y2的约简型存在
识别问题
- 秩条件:识别联立方程模型中第一个方程的充要条件是: 第二个方程中至少包含一个并不出现在第一个方程的外生解释变量且该变量具有非零系数
估计问题
- 用所有外生变量当作识别方程中内生解释变量的工具变量,采用2SLS法进行估计
已婚工作妇女的劳动供给
通货膨胀与开放度
多于两个方程的系统
{ y 1 = α 12 y 2 + α 13 y 3 + β 11 z 1 + u 1 ( 7 ) y 2 = α 21 y 1 + β 21 z 1 + β 22 z 2 + β 23 z 3 + u 2 ( 8 ) y 3 = α 32 y 2 + β 31 z 1 + β 32 z 2 + β 33 z 3 + β 34 z 4 + u 3 ( 9 ) \begin{cases} y_1 = \alpha_{12}y_2 + \alpha_{13}y_3 + \beta_{11} z_1 + u_1 \qquad (7)\\ y_2 = \alpha_{21}y_1 + \beta_{21}z_1 + \beta_{22}z_2 + \beta_{23} z_3 + u_2 \qquad (8) \\ y_3 = \alpha_{32}y_2 + \beta_{31}z_1 + \beta_{32}z_2 + \beta_{33} z_3 + \beta_{34} z_4 + u_3 \qquad (9) \\ \end{cases} ⎩⎪⎨⎪⎧y1=α12y2+α13y3+β11z1+u1(7)y2=α21y1+β21z1+β22z2+β23z3+u2(8)y3=α32y2+β31z1+β32z2+β33z3+β34z4+u3(9)
对比 ( 7 ) 和 ( 9 ) (7)和(9) (7)和(9), ( 9 ) (9) (9)是无法识别的, ( 7 ) 和 ( 8 ) (7)和(8) (7)和(8), ( 8 ) (8) (8)是无法识别的,而对比 ( 8 ) 和 ( 9 ) (8)和(9) (8)和(9), ( 9 ) (9) (9)是无法识别的;
一般规则: 对任何一个额SEM中的方程,如果它排除的外生变量数不少于其右端包含的内生变量数,那么就满足识别的阶条件;
注意: 阶条件只是可识别的必要条件,还要满足系数不为零才是秩条件,但是我们不能确切的知道系数是否为0。所以一般来说,只要不是明显的不可识别,只要满足阶条件就认为可识别了;
- 过度识别方程: ( 7 ) (7) (7) 内生变量数少于排除的外生变量数
- 恰好识别方程: ( 8 ) (8) (8) 内生变量数等于排除的外生变量数
- 不可识别方程: ( 9 ) (9) (9) 内生变量数多于排除的外生变量数
与前面的类似,估计多于两个方程的系统也是用2SLS法;
时间序列的联立方程模型
对SEM最早的应用之一就是,估计一个用于描述国家经济体系的大型联立方程系统。总需求的一个简单凯恩斯模型是
C
t
=
β
0
+
β
1
(
Y
t
−
T
t
)
+
β
2
r
t
+
u
t
1
(
11
)
I
t
=
γ
0
+
γ
1
r
t
+
u
t
2
(
12
)
Y
t
=
C
t
+
I
t
+
G
t
(
13
)
\begin{aligned} C_t &= \beta_0 + \beta_1(Y_t - T_t) + \beta_2 r_t + u_{t1} \qquad (11)\\ I_t &= \gamma_0 + \gamma_1r_t + u_{t2} \qquad (12)\\ Y_t &= C_t + I_t + G_t \qquad (13) \end{aligned}
CtItYt=β0+β1(Yt−Tt)+β2rt+ut1(11)=γ0+γ1rt+ut2(12)=Ct+It+Gt(13)
其中,
C
t
C_t
Ct表示消费,
Y
t
Y_t
Yt表示收入,
T
t
T_t
Tt表示税收收入,
r
t
r_t
rt表示利率,
I
t
I_t
It表示投资,
G
t
G_t
Gt表示政府支出
- ( 11 ) (11) (11)是总消费函数,其中消费取决于可支配收入,利率和观测不到的结构性误差
- ( 12 ) (12) (12)是投资函数,取决于利率
- ( 13 ) (13) (13)则是一个恒等式,没啥意义,但是为了保持完整;
因为是三个方程,那么一定有3个内生变量
- C t , I t , Y t C_t,I_t,Y_t Ct,It,Yt是内生变量,而 T t , r t , G t T_t,r_t,G_t Tt,rt,Gt是外生变量
估计过程
- 由于 r t r_t rt是外生变量,所以直接用OLS估计 ( 12 ) (12) (12)
- 选择 ( T t , G t , r t ) (T_t,G_t,r_t) (Tt,Gt,rt)作为 Y t Y_t Yt的工具变量,使用2SLS估计 ( 11 ) (11) (11)
注意:
- 现在很少有上例这样的模型了,因为税收、利率、政府支出都不是外生的,税收取决于收入,政府支出也取决与收入,利率又由消费、投资和收入联合决定;
- 而且上例的模型是完全静态的,通常要有预期的时滞调整
I t = γ 0 + γ 1 r t + γ 1 Y t − 1 + u t 2 ( 12 ) I_t = \gamma_0 + \gamma_1r_t + \gamma_1Y_{t-1} + u_{t2} \qquad (12)\\ It=γ0+γ1rt+γ1Yt−1+ut2(12)
我们在投资方程中增加了一个滞后内生变量,我们通常将一个SEM中的滞后内生变量专门称为前定变量,如果我们假定 u t 2 u_{t2} ut2与当前的外生变量、过去所有时刻的内生和外生变量都无关,你们前定变量就是外生变量;
但是将SEM中加入时间序列还会面临时间序列数据的经典问题:
- 对于总消费、收入、投资、利率等数据不一定满足弱相关假定;
- 有些序列还有指数趋势;
但是仍然可以解决,就是使用一阶差分或增长率的方式来回避这些问题
对持久性收入假说的检验
面板数据的联立方程模型
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)