目录

一、数据准备

二、描述性统计分析

三、固定效应模型的估计

个体固定效应模型

时间固定效应模型

四、代码解释

五、输出结果解读

六、假设检验

七、模型选择与比较

代码附录


在社会科学研究中,固定效应模型是一种常用的统计分析方法,用于处理面板数据中的个体异质性问题。本文将以 STATA 软件为例,详细介绍固定效应模型的具体操作步骤,并结合实际数据进行案例分析。

一、数据准备

假设我们有一份关于不同城市不同年份的经济数据,数据名为“economy.dta”,包含城市(city)、年份(year)、GDP 增长率(gdp_growth)、投资增长率(investment_growth)和消费增长率(consumption_growth)等变量。

use "economy.dta", clear

这一步的作用是将我们准备好的数据文件“economy.dta”加载到 STATA 中,以便后续进行分析和处理。

二、描述性统计分析

在进行回归分析之前,先对数据进行描述性统计分析,了解数据的基本特征。

summarize gdp_growth investment_growth consumption_growth

这一步骤的目的是获取各个变量的基本统计信息,如均值、标准差、最小值、最大值等。通过这些统计量,我们可以对数据的分布和集中趋势有一个初步的了解,从而为后续的建模分析提供参考。比如,如果均值和中位数相差较大,可能表明数据存在偏态;标准差较大则说明数据的离散程度较高。

三、固定效应模型的估计

  1. 个体固定效应模型

xtreg gdp_growth investment_growth consumption_growth, fe

这里,“xtreg”是用于面板数据回归的命令。“gdp_growth”是我们要研究的因变量,即我们关心其如何受到其他变量影响的变量。“investment_growth”和“consumption_growth”是自变量,我们假设它们会对 GDP 增长率产生影响。“fe”选项表示我们要估计个体固定效应模型,也就是控制每个城市自身不随时间变化的特有因素对 GDP 增长率的影响。

  1. 时间固定效应模型

xtreg gdp_growth investment_growth consumption_growth, fe i(year)

在这个模型中,除了控制个体固定效应(城市特有的因素)外,通过“i(year)”我们还纳入了时间固定效应。这意味着控制了不同年份的共同影响,例如宏观经济政策、全球经济形势等对所有城市普遍产生作用的因素。

四、代码解释

  1. 在个体固定效应模型的代码中,STATA 会根据城市的不同来控制个体固定效应,从而更准确地估计自变量对因变量的影响。它通过在模型中引入一系列虚拟变量来表示不同的城市,从而消除城市个体之间不随时间变化的差异。
  2. 在时间固定效应模型的代码中,除了控制城市固定效应外,还通过“i(year)”控制了时间固定效应。这相当于为每一个年份创建一个虚拟变量,以捕捉不同年份的共同影响。

五、输出结果解读

执行上述命令后,STATA 会输出一系列结果,包括回归系数、标准误、t 值、p 值等。
例如:

Fixed-effects (within) regression               Number of obs     =    500
Group variable: city                              Number of groups  =     50

R-sq:  within  = 0.6000                        Obs per group: min =    5
                                                   avg =   10.0
                                                   max =   15

                                                F(  2,  448) =   150.00
                                                Prob > F      =  0.0000

------------------------------------------------------------------------------
             |               Robust
 gdp_growth  |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
investment_growth |      0.400     0.080      5.00   0.000     0.240     0.560
consumption_growth |      0.300     0.060      5.00   0.000     0.180     0.420
       _cons |      2.000     0.150     13.33   0.000     1.700     2.300
------------------------------------------------------------------------------
  • “Number of obs”表示观测值的数量。
  • “Number of groups”表示分组(城市)的数量。
  • “R-sq: within”表示组内(城市内部)的决定系数,反映了模型在控制城市固定效应后的解释能力。值越高,说明自变量对因变量的解释程度越高。
  • “F( 2, 448)”是 F 统计量,用于检验模型的整体显著性。
  • “Prob > F”是对应的 p 值,如果这个值很小(通常小于 0.05),说明模型整体是显著的。
  • 对于每个自变量(如 investment_growth 和 consumption_growth),“Coef.”是回归系数,表示在其他条件不变的情况下,自变量每增加一个单位,因变量的平均变化量。
  • “Std. Err.”是标准误,反映了回归系数估计的不确定性。
  • “t”是 t 值,用于检验回归系数是否显著不为零。
  • “P>|t|”是 p 值,当 p 值小于 0.05 时,通常认为该自变量对因变量的影响是显著的。
  • “[95% Conf. Interval]”是 95%的置信区间,如果零值不在这个区间内,也说明回归系数显著不为零。

六、假设检验

  1. 个体固定效应的显著性检验
    可以通过“testparm i.city”命令来检验城市固定效应是否显著。如果 p 值很小,说明城市固定效应是显著的,即不同城市之间存在不随时间变化的显著差异。

  2. 时间固定效应的显著性检验
    对于时间固定效应,可以使用“test i.year”命令进行检验。若 p 值小,意味着时间固定效应显著,即不同年份有共同的显著影响。

七、模型选择与比较

如果我们同时考虑个体固定效应和时间固定效应,可以通过比较不同模型的拟合优度、AIC、BIC 等指标来选择最优模型。

例如,我们可以估计一个同时包含城市和时间固定效应的模型:

xtreg gdp_growth investment_growth consumption_growth, fe i(year) i(city)

然后与之前的城市固定效应模型和时间固定效应模型进行比较。

  • 拟合优度通常用 R-squared 来衡量,值越接近 1 表示模型对数据的拟合越好。
  • AIC(赤池信息准则)和 BIC(贝叶斯信息准则)则是用于权衡模型的复杂度和拟合优度。值越小,说明模型在拟合数据和简洁性之间的平衡越好。

代码附录

以下是补充的程序代码附录:

* 假设我们的数据名为 "economy.dta" ,包含变量 city (城市)、 year (年份)、 gdp_growth (GDP 增长率)、 investment_growth (投资增长率)和 consumption_growth (消费增长率)

* 加载数据
use "economy.dta", clear

* 描述性统计
summarize gdp_growth investment_growth consumption_growth

* 个体固定效应模型
xtreg gdp_growth investment_growth consumption_growth, fe

* 个体固定效应的显著性检验
testparm i.city

* 时间固定效应模型
xtreg gdp_growth investment_growth consumption_growth, fe i(year)

* 时间固定效应的显著性检验
test i.year

* 同时包含个体和时间固定效应的模型
xtreg gdp_growth investment_growth consumption_growth, fe i(year) i(city)

* 生成预测值
predict gdp_growth_hat

panel data(一)|FE & RE (qq.com)icon-default.png?t=N7T8https://mp.weixin.qq.com/s?__biz=MzA3NjYwNzI5Nw==&mid=2247488641&idx=1&sn=dbe85104157603ba9cd9b09d139b734a&chksm=9f5feeafa82867b9349efb88c47762435b04d1e5f60fcdc12ba8c470cddfa8b6762a23f31f5c#rd

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐