6.1 为何需要大样本理论

(1)小样本理论的假设过强。
首先,小样本理论的严格外生性假设要求解释变量与所有的扰动项均正交(不相关)。大样本理论则只要求解释变量与同期(同方程)的扰动项不相关。
其次,小样本理论假定扰动项为正态分布,而大样本理论无此限制。在很多情况下,我们并无法把握经济变量是否服从正态分布。
(2)在小样本理论的框架下,我们必须研究统计量的精确分布,但常常难以推导。而根据大样本理论,只要研究统计量的大样本分布,相对比较容易推导(可使用大数定律与中心极限定理)。
(3)使用大样本理论的代价是要求样本容量较大,以便大数定律与中心极限定理可以起作用。
样本容量一般至少 n ≥ 30 n\geq30 n30,最好在100以上。

6.2 随机收敛

在这里插入图片描述

1.确定性序列的收敛
在这里插入图片描述

2.随机序列的收敛

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

3.依均方收敛
在这里插入图片描述
依均方收敛意味着依概率收敛;反之,依概率收敛并不意味着依均方收敛

4.依分布收敛
在这里插入图片描述
在这里插入图片描述

  • 举个例子
    t t t分布的自由度越来越大是, t t t分布依分布收敛于标准正态分布,即当 k → ∞ k\rightarrow\infty k时, t ( k ) ⟶ a N ( 0 , 1 ) t(k)\stackrel{a}{\longrightarrow}N(0,1) t(k)aN(0,1)
分布函数
twoway function N=normal(x),range(-5 5)||function t1=t(1,x),range(-5 5) lp(dash)||function t5=t(5,x),range(-5 5) lp(shortdash) ytitle(累积分布函数)

在这里插入图片描述

概率密度
twoway function N=normalden(x),range(-5 5)||function t1=tden(1,x),range(-5 5) lp(dash)||function t5=tden(5,x),range(-5 5) lp(shortdash) ytitle(概率密度)

在这里插入图片描述

  • 依分布收敛的运算
    在这里插入图片描述
    在这里插入图片描述
summary:依均方收敛→依概率收敛→依分布收敛

6.3 大数定律与中心极限定理

1.大数定律【样本均值依概率收敛于总体期望】

在这里插入图片描述

2.中心极限定理【样本均值的分布近似正态分布】

在这里插入图片描述
在这里插入图片描述

6.4 使用蒙特卡罗法模拟中心极限定理

目标:验证 样本均值这个随机变量 是否 渐进正态分布
思路:x服从(0,1)上的均匀分布,抽取10000组样本,每组样本容量30,就是10000个30,计算出10000个样本均值,将这10000个样本均值画出来,看看是不是正态分布的形状

//哇,好久没写代码了,这有点写函数的感觉,我既熟悉又陌生。
program onesample,rclass //写一个子程序,以r()形式储存
	drop _all  //删去内存中已有数据
	set obs 30
	gen x=runiform()  //得到在(0,1)上均匀分布的随机样本
	sum x
	return scalar mean_sample=r(mean)  //样本均值记为mean_sample。
	end //程序onesample结束
	
set more off
simulate xbar=r(mean_sample),seed(101) reps(10000) nodots:onesample
//nodots表示不显示表示模拟过程的点(默认以一个点表示抽取一个样本)
hist xbar,normal

在这里插入图片描述

在这里插入图片描述

6.5 统计量的大样本性质

在这里插入图片描述

  • 一致估计量
    在这里插入图片描述在这里插入图片描述

  • 渐近正态分布、渐近方差、渐进有效
    在这里插入图片描述
    在这里插入图片描述

6.6 随机过程的性质

  • 严格平稳过程【无论怎么取,分布都一样】
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
  • 弱平稳过程【只要求二阶矩平稳(即期望、方差、协方差等不随时间而变),更高阶的不能保证】
    在这里插入图片描述

严格平稳过程一定是弱平稳过程,反之则不然。
在这里插入图片描述

白噪声
在这里插入图片描述

多维
在这里插入图片描述

  • 渐近独立性/弱相依
    只要两个随机变量相距足够远,可近似认为他们相互独立。
    AR(1)模型为渐近独立的过程

  • 渐近独立定理【大数定律的推广:不需要idd,只要求渐近独立的严格平稳过程,样本均值估计期望】
    在这里插入图片描述
    类似地,可将中心极限定理作相应的推广;即在一定条件下,中心极限定理也适用于渐近独立的平稳过程。

    (有点像嵌套)
    在这里插入图片描述

6.7 大样本OLS的假定

在这里插入图片描述

在这里插入图片描述

6.8 OLS的大样本性质

忘记了去看一下6.5

在假定6.1—6.4之下,可以证明OLS估计量 β ^ \boldsymbol{\hat\beta} β^具有以下良好的大样本性质。

(1) β ^ \boldsymbol{\hat\beta} β^为一致估计量,即 p l i m n → ∞ β ^ = β \mathop{plim}\limits_{n\rightarrow\infty}\boldsymbol{\hat\beta=\beta} nplimβ^=β
证明略
证明的核心就是前定解释变量假设【解释变量和扰动项不相关,协方差为0】
下面的图是协方差不为0的情况,老师解释很久,比较有代表性的图
在这里插入图片描述
如果不满足前定解释变量假设,即使样本容量再大也会有偏差

在计量经济学中,如果解释变量与扰动项相关,即二者的协方差不等于0,则称此解释变量为“内生解释变量”,简称“内生变量”,反之,则为“外生变量”。由于内生变量的存在,致使OLS回归出现偏差,统称为“内生性偏差”,或简称“内生性”。
如果存在遗漏变量、双向因果关系或解释变量测量误差,则常会出现解释变量与扰动项同期相关的情形,导致OLS不一致。

(2) β ^ \boldsymbol{\hat\beta} β^服从渐近正态分布
在这里插入图片描述

(3)渐近协方差矩阵 A v a r ( β ^ ) Avar(\boldsymbol{\hat\beta}) Avar(β^)

数学推导没有细研究,为了心情愉快地继续学,暂时先放一下

β ^ \boldsymbol{\hat\beta} β^的渐近方差估计量:
A v a r ( β ^ ∣ X ) ^ = n ( X ′ X ) − 1 X ′ V a r ( β ∣ X ) ^ X ( X ′ X ) − 1 \widehat{Avar(\boldsymbol{\hat\beta|X})}=n\boldsymbol{(X'X)^{-1}X'}\widehat{Var(\boldsymbol{\beta|X})}\boldsymbol{X(X'X)^{-1}} Avar(β^X) =n(XX)1XVar(βX) X(XX)1
上式没有假设“条件同方差”,它提供了在“条件异方差”情况下也成立的标准误,称为“异方差稳健的标准误”,简称“稳健标准误”。

6.9 大样本统计推断

1.检验单个系数: H 0 : β k = c H_0:\beta_k=c H0:βk=c
定义 t t t统计量为
在这里插入图片描述
2.检验线性假设: H 0 : R β = r H_0:R\beta=r H0:=r
在这里插入图片描述

6.10 大样本OLS的Stata实例

在这里插入图片描述
OLS估计的稳健标准误reg y x1 x2 x3,robust

以数据集 nerlove.dta 为例

  • 使用普通标准误进行 OLS 估计
use nerlove.dta,clear
reg lntc lnq lnpl lnpk lnpf

在这里插入图片描述

显示规模报酬,“1/_b[lnq]” 表示lnq的OLS系数估计值

display 1/_b[lnq]

在这里插入图片描述
大于1,规模报酬递增

检验规模报酬不变的原假设 H 0 : r = 1 H_0:r=1 H0:r=1

test lnq=1

在这里插入图片描述
p值为0,强烈拒绝原假设,认为存在规模报酬递增

  • 使用稳健标准误重新进行回归
    在这里插入图片描述

    如果认为存在异方差,则应使用稳健标准误。在异方差的情况下,如果使用普通标准误,将大大低估变量ln Q系数的真实标准误,从而导致不正确的统计推断。如何检验异方差,将在第7章介绍。

6.11 大样本理论的蒙特卡洛模拟

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐