看《实用极值统计方法》-----史道济所得。

前言

上一节中,我们讨论了通过观测超过阈值\mu的观测值,并用超阈值分布或超出量分布函数来描述,以充分利用观测值数列中的信息。但是,在一般情况下,观测值序列的底分布F(x)我们并不知道。于是,我们就要考虑它们的极限分布,就像GEV分布描述最大值的极限分布一样,我们也希望能够找到超出量的极限分布。

一、广义Pareto分布

定义:如果随机变量X的分布函数为

G(x;\mu,\delta,\varepsilon )=1-(1+\varepsilon \frac{x-\mu}{\delta})^{-1/\varepsilon } ,x\geq \mu,1+\varepsilon (x-\mu)/\delta>0

则称X服从广义Pareto分布,简记为GPD或GP分布。其中\mu \in R是位置参数,\delta >0为尺度参数,\varepsilon \in R为形状参数。

另一种表示方法:

ParetoⅠ型分布:G_{1}(x;\mu,\delta)=\left\{\begin{matrix} 1-e^{-\frac{x-\mu}{\delta}},x\geq \mu\\ 0,x<\mu \end{matrix}\right.

ParetoⅡ型分布:G_{2}(x;\mu,\delta,\alpha )=\left \{\begin{matrix} 1-(\frac{x-\mu}{\delta})^{-\alpha },x\geq \mu+\delta\\ 0,x<\mu+\delta \end{matrix}\right.,\alpha >0

ParetoⅢ型分布:G_{3}(x;\mu,\delta,\alpha )=\left\{\begin{matrix} 0,x<\mu-\delta\\ 1-(-\frac{x-\mu}{\delta})^{\alpha },\mu-\delta\leq x\leq \mu\\ 1,x>\mu \end{matrix}\right.,\alpha >0

\mu=0,\delta=1时,称为标准GPD。可以看出,当\ln H_{i}>-1时,有G_{i}=1+\ln H_{i}。可见,广义极值分布和广义Pareto分布之间有着非常密切的关系。当\mu = 0,\delta>0时,分布函数G(x;0,\delta,\varepsilon )有重要作用,称为二参的广义Pareto分布,简记为G(x;\delta,\varepsilon )

不难求出,其密度函数为:

g(x;\mu,\delta,\varepsilon )=\frac{1}{\delta}(1+\varepsilon \frac{x-\mu}{\delta})^{-1/\varepsilon -1},x\geq \mu,1+\varepsilon (x-\mu)/\delta>0

另一种表示方法:

g_{1}(x;\mu,\delta)=\frac{1}{\delta}e^{-\frac{x-\mu}{\delta}},x\geq \mu

g_{2}(x;\mu,\delta,\alpha )=\frac{\alpha }{\delta}(\frac{x-\mu}{\delta})^{-\alpha -1},x\geq \mu+\delta;\alpha >0

g_{3}(x;\mu,\delta,\alpha )=\frac{\alpha }{\delta}(-\frac{x-\mu}{\delta})^{\alpha -1},\mu-\delta\leq x\leq \mu,\alpha >0

二、广义Pareto分布的性质

同极值分布一样,根据Gamma函数的性质,可以很方便地求出广义Pareto分布地数字特征。这里,只给出二参广义Pareto分布G(x;\delta,\varepsilon )的数字特征。

性质:设随机变量X服从广义Pareto分布G(x;\delta,\varepsilon ),则当\varepsilon <1/k时,

E(X^{k})=\frac{\delta^{k}F(\varepsilon ^{-1}-k)}{\varepsilon ^{k+1}F(1+\varepsilon ^{-1})}k!,其中F(x)为Gamma函数。

定义:对于给定的分布函数F(x),如果存在常数a_{n},b_{n},使得对任何实数x,都有

F_{\mu}(a_{n}x+b_{n})=F(x)

其中F_{\mu}(y)=P_{r}(X-\mu\leq y|X>\mu)是超出量分布函数,则称分布函数F(x)具有POT稳定性,或称分布函数F(x)是POT稳定分布。

性质:广义Pareto是POT稳定分布。

性质:广义Pareto分布的超出量分布函数仍然是GP分布,且形状参数不变。

定义:设随机变量X的分布函数为F(x)x^{*}F(x)支撑的上端点,X超过阈值\mu的超出量分布为F_{u}(x),如果存在广义Pareto分布G(x),使得

\lim_{\mu\rightarrow x^{*}}F_{u}(x)=G(x)

则称X(或分布函数F(x))属于广义Pareto分布的POT吸引场。

性质:广义极值分布属于广义Pareto分布的POT吸引场。

性质:广义Pareto分布属于广义极值分布的最大值吸引场。

定理:设X_{1},X_{2},\cdot \cdot \cdot为独立同分布随机变量,分布函数为F(x)。令M_{n}=\max \{ X_{1},\cdot \cdot \cdot ,X_{n} \},如果存在规范化数列\{ a_{n}>0 \},\{ b_{n} \},使得对足够大的n,有

P_{r}(M_{n}\leq a_{n}x+b_{n})\approx H(x;\mu,\delta,\varepsilon )

其中H(x;\mu,\delta,\varepsilon )是广义极值分布,则对于足够大的阈值u,在X>\mu的条件下,X-u的分布近似于GP分布

G(y;\delta',\varepsilon )=1-(1+\varepsilon y/\delta)^{-1/\varepsilon },y>0;1+\varepsilon y/\delta'>0

其中\delta'=\delta+\varepsilon (u-\mu)

性质:GP分布的平均超出量函数为

e(u)=\frac{\delta+\varepsilon (u-\mu)}{1-\varepsilon }

定义:设随机变量X的分布函数为F(x),对应的密度函数为f(x)x^{*}F(x)支撑的上端点,对于给定的t<x^{*}

q(t)=\frac{f(t)}{1-F(t)}

为随机变量X(或分布F)的危险率函数。

 

 

 

 

 

 

 

 

 

Logo

瓜分20万奖金 获得内推名额 丰厚实物奖励 易参与易上手

更多推荐