两个独立的正态分布的乘积公式

正态分布的密度函数:
f ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 \begin{align*} f(x) = \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}} \end{align*} f(x)=2π σ1e2σ2(xμ)2

在进行理论推导之前,我们先通过Matlab数值计算看看两独立正态分布的乘积情况:
在这里插入图片描述
如图所示绿色和红色分别代表两个独立的正态分布函数,蓝色为两个分布的乘积。

从蓝色形状可以粗略的看出乘积结果可能为一个幅值被压缩的正态分布,其期望在 [ μ 1 , μ 2 ] [\mu_1,\mu_2 ] [μ1,μ2]之间,但是还需严格的理论推导。

N 1 N_1 N1的概率密度函数为 f 1 ( x ) = 1 2 π σ 1 e − ( x − μ 1 ) 2 2 σ 1 2 f_1(x) = \frac{1}{\sqrt{2\pi}\sigma_1}e^{-\frac{(x-\mu_1)^2}{2\sigma_1^2}} f1(x)=2π σ11e2σ12(xμ1)2 N 2 N_2 N2的概率密度函数为 f 2 ( x ) = 1 2 π σ 2 e − ( x − μ 2 ) 2 2 σ 2 2 f_2(x) = \frac{1}{\sqrt{2\pi}\sigma_2}e^{-\frac{(x-\mu_2)^2}{2\sigma_2^2}} f2(x)=2π σ21e2σ22(xμ2)2,则:

f 1 ( x ) f 2 ( x ) = 1 2 π σ 1 e − ( x − μ 1 ) 2 2 σ 1 2 ⋅ 1 2 π σ 2 e − ( x − μ 2 ) 2 2 σ 2 2 = 1 2 π σ 1 σ 2 e − [ ( x − μ 1 ) 2 2 σ 1 2 + ( x − μ 2 ) 2 2 σ 2 2 ] \begin{align*} f_1(x)f_2(x) &= \frac{1}{\sqrt{2\pi}\sigma_1}e^{-\frac{(x-\mu_1)^2}{2\sigma_1^2}} \cdot \frac{1}{\sqrt{2\pi}\sigma_2}e^{-\frac{(x-\mu_2)^2}{2\sigma_2^2}}\\ &= \frac{1}{2\pi\sigma_1\sigma_2}e^{-[\frac{(x-\mu_1)^2}{2\sigma_1^2}+\frac{(x-\mu_2)^2}{2\sigma_2^2}]} \end{align*} f1(x)f2(x)=2π σ11e2σ12(xμ1)22π σ21e2σ22(xμ2)2=2πσ1σ21e[2σ12(xμ1)2+2σ22(xμ2)2]

先单独分析指数部分:
令  β = ( x − μ 1 ) 2 2 σ 1 2 + ( x − μ 2 ) 2 2 σ 2 2 = ( σ 1 2 + σ 2 2 ) x 2 − 2 ( μ 1 σ 2 2 + μ 2 σ 1 2 ) x + ( μ 1 2 σ 2 2 + μ 2 2 σ 1 2 ) 2 σ 1 2 σ 2 2 = x 2 − 2 μ 1 σ 2 2 + μ 2 σ 1 2 σ 1 2 + σ 2 2 x + μ 1 2 σ 2 2 + μ 2 2 σ 1 2 σ 1 2 + σ 2 2 2 σ 1 2 σ 2 2 σ 1 2 + σ 2 2 \begin{align*} 令\ \beta&= \frac{(x-\mu_1)^2}{2\sigma_1^2}+\frac{(x-\mu_2)^2}{2\sigma_2^2} \\ &= \frac{(\sigma_1^2+\sigma_2^2)x^2-2(\mu_1\sigma_2^2+\mu_2\sigma_1^2)x+(\mu_1^2\sigma_2^2+\mu_2^2\sigma_1^2)}{2\sigma_1^2\sigma_2^2} \\ &= \frac{x^2-2\frac{\mu_1\sigma_2^2+\mu_2\sigma_1^2}{\sigma_1^2+\sigma_2^2}x+\frac{\mu_1^2\sigma_2^2+\mu_2^2\sigma_1^2}{\sigma_1^2+\sigma_2^2}}{\frac{2\sigma_1^2\sigma_2^2}{\sigma_1^2+\sigma_2^2}} \end{align*}  β=2σ12(xμ1)2+2σ22(xμ2)2=2σ12σ22(σ12+σ22)x22(μ1σ22+μ2σ12)x+(μ12σ22+μ22σ12)=σ12+σ222σ12σ22x22σ12+σ22μ1σ22+μ2σ12x+σ12+σ22μ12σ22+μ22σ12
构造:
β = ( x − μ 1 σ 2 2 + μ 2 σ 1 2 σ 1 2 + σ 2 2 ) 2 2 σ 1 2 σ 2 2 σ 1 2 + σ 2 2 ⏟ γ + μ 1 2 σ 2 2 + μ 2 2 σ 1 2 σ 1 2 + σ 2 2 − ( μ 1 σ 2 2 + μ 2 σ 1 2 σ 1 2 + σ 2 2 ) 2 2 σ 1 2 σ 2 2 σ 1 2 + σ 2 2 ⏟ λ \begin{align*} \beta = \underbrace{\frac{(x-\frac{\mu_1\sigma_2^2+\mu_2\sigma_1^2}{\sigma_1^2+\sigma_2^2})^2}{\frac{2\sigma_1^2\sigma_2^2}{\sigma_1^2+\sigma_2^2}}}_{\gamma} + \underbrace{\frac{\frac{\mu_1^2\sigma_2^2+\mu_2^2\sigma_1^2}{\sigma_1^2+\sigma_2^2}-(\frac{\mu_1\sigma_2^2+\mu_2\sigma_1^2}{\sigma_1^2+\sigma_2^2})^2}{\frac{2\sigma_1^2\sigma_2^2}{\sigma_1^2+\sigma_2^2}}}_{\lambda} \end{align*} β=γ σ12+σ222σ12σ22(xσ12+σ22μ1σ22+μ2σ12)2+λ σ12+σ222σ12σ22σ12+σ22μ12σ22+μ22σ12(σ12+σ22μ1σ22+μ2σ12)2
β = γ + λ \beta = \gamma + \lambda β=γ+λ

记:
μ = μ 1 σ 2 2 + μ 2 σ 1 2 σ 1 2 + σ 2 2 σ 2 = σ 1 2 σ 2 2 σ 1 2 + σ 2 2 \begin{align*} \mu & = \frac{\mu_1\sigma_2^2+\mu_2\sigma_1^2}{\sigma_1^2+\sigma_2^2} \\ \sigma^2 &= \frac{\sigma_1^2\sigma_2^2}{\sigma_1^2+\sigma_2^2} \end{align*} μσ2=σ12+σ22μ1σ22+μ2σ12=σ12+σ22σ12σ22
则:
γ = ( x − μ ) 2 2 σ 2 \begin{align*} \gamma = \frac{(x-\mu)^2}{2\sigma^2} \end{align*} γ=2σ2(xμ)2
继续化简 λ \lambda λ

λ = μ 1 2 σ 2 2 + μ 2 2 σ 1 2 σ 1 2 + σ 2 2 − ( μ 1 σ 2 2 + μ 2 σ 1 2 σ 1 2 + σ 2 2 ) 2 2 σ 1 2 σ 2 2 σ 1 2 + σ 2 2 = ( μ 1 2 σ 2 2 + μ 2 2 σ 1 2 ) ( σ 1 2 + σ 2 2 ) − ( μ 1 σ 2 2 + μ 2 σ 1 2 ) 2 2 σ 1 2 σ 2 2 ( σ 1 2 + σ 2 2 ) = μ 1 2 σ 1 2 σ 2 2 + μ 2 2 σ 1 2 σ 2 2 + μ 1 2 σ 2 4 + μ 2 2 σ 1 4 − ( μ 1 2 σ 2 4 + μ 2 2 σ 1 4 + 2 μ 1 μ 2 σ 1 2 σ 2 2 ) 2 σ 1 2 σ 2 2 ( σ 1 2 + σ 2 2 ) = σ 1 2 σ 2 2 ( μ 1 2 − 2 μ 1 μ 2 + μ 2 2 ) 2 σ 1 2 σ 2 2 ( σ 1 2 + σ 2 2 ) = ( μ 1 − μ 2 ) 2 2 ( σ 1 2 + σ 2 2 ) \begin{align*} \lambda &= \frac{\frac{\mu_1^2\sigma_2^2+\mu_2^2\sigma_1^2}{\sigma_1^2+\sigma_2^2}-(\frac{\mu_1\sigma_2^2+\mu_2\sigma_1^2}{\sigma_1^2+\sigma_2^2})^2}{\frac{2\sigma_1^2\sigma_2^2}{\sigma_1^2+\sigma_2^2}}\\ &= \frac{(\mu_1^2\sigma_2^2+\mu_2^2\sigma_1^2)(\sigma_1^2+\sigma_2^2)-(\mu_1\sigma_2^2+\mu_2\sigma_1^2)^2}{2\sigma_1^2\sigma_2^2(\sigma_1^2+\sigma_2^2)} \\ &= \frac{\mu_1^2\sigma_1^2\sigma_2^2+\mu_2^2\sigma_1^2\sigma_2^2 + \mu_1^2\sigma_2^4 +\mu_2^2\sigma_1^4 -(\mu_1^2\sigma_2^4+\mu_2^2\sigma_1^4+2\mu_1\mu_2\sigma_1^2\sigma_2^2)}{2\sigma_1^2\sigma_2^2(\sigma_1^2+\sigma_2^2)} \\ &= \frac{ \sigma_1^2\sigma_2^2(\mu_1^2-2\mu_1\mu_2+\mu_2^2) } {2\sigma_1^2\sigma_2^2(\sigma_1^2+\sigma_2^2)} \\ &= \frac{(\mu_1-\mu_2)^2}{2(\sigma_1^2+\sigma_2^2)} \end{align*} λ=σ12+σ222σ12σ22σ12+σ22μ12σ22+μ22σ12(σ12+σ22μ1σ22+μ2σ12)2=2σ12σ22(σ12+σ22)(μ12σ22+μ22σ12)(σ12+σ22)(μ1σ22+μ2σ12)2=2σ12σ22(σ12+σ22)μ12σ12σ22+μ22σ12σ22+μ12σ24+μ22σ14(μ12σ24+μ22σ14+2μ1μ2σ12σ22)=2σ12σ22(σ12+σ22)σ12σ22(μ122μ1μ2+μ22)=2(σ12+σ22)(μ1μ2)2

可得两个高斯分布相乘为:
f 1 ( x ) f 2 ( x ) = 1 2 π σ 1 σ 2 e − β = 1 2 π σ 1 σ 2 e − ( γ + λ ) = 1 2 π σ 1 σ 2 e − γ ⋅ e − λ = 1 2 π σ 1 σ 2 e − ( x − μ ) 2 σ 2 ⋅ e − ( μ 1 − μ 2 ) 2 2 ( σ 1 2 + σ 2 2 ) \begin{align*} f_1(x)f_2(x) &= \frac{1}{2\pi\sigma_1\sigma_2}e^{-\beta} = \frac{1}{2\pi\sigma_1\sigma_2}e^{-(\gamma + \lambda)} \\ &= \frac{1}{2\pi\sigma_1\sigma_2} e^{-\gamma}\cdot e^{-\lambda} \\ &= \frac{1}{2\pi\sigma_1\sigma_2} e^{- \frac{(x-\mu)^2}{\sigma^2}} \cdot e^{- \frac{(\mu_1-\mu_2)^2}{2(\sigma_1^2+\sigma_2^2)}} \end{align*} f1(x)f2(x)=2πσ1σ21eβ=2πσ1σ21e(γ+λ)=2πσ1σ21eγeλ=2πσ1σ21eσ2(xμ)2e2(σ12+σ22)(μ1μ2)2

其中
μ = μ 1 σ 2 2 + μ 2 σ 1 2 σ 1 2 + σ 2 2 σ 2 = σ 1 2 σ 2 2 σ 1 2 + σ 2 2 \begin{align*} \mu & = \frac{\mu_1\sigma_2^2+\mu_2\sigma_1^2}{\sigma_1^2+\sigma_2^2} & &\sigma^2 = \frac{\sigma_1^2\sigma_2^2}{\sigma_1^2+\sigma_2^2} \end{align*} μ=σ12+σ22μ1σ22+μ2σ12σ2=σ12+σ22σ12σ22

把常数项综合为 S g S_g Sg, 可得其直观表达式:

f 1 ( x ) f 2 ( x ) = S g ⋅ 1 2 π σ e − ( x − μ ) 2 σ 2 S g = 1 2 π ( σ 1 2 + σ 2 2 ) ⋅ e − ( μ 1 − μ 2 ) 2 2 ( σ 1 2 + σ 2 2 ) \begin{align*} f_1(x)f_2(x) &= S_g \cdot \frac{1}{\sqrt{2\pi}\sigma} e^{- \frac{(x-\mu)^2}{\sigma^2}} \\ S_g &= \frac{1}{\sqrt{2\pi(\sigma_1^2+\sigma_2^2)}} \cdot e^{- \frac{(\mu_1-\mu_2)^2}{2(\sigma_1^2+\sigma_2^2)}} \end{align*} f1(x)f2(x)Sg=Sg2π σ1eσ2(xμ)2=2π(σ12+σ22) 1e2(σ12+σ22)(μ1μ2)2

到此,两个正态分布相乘的分布函数即推导出来,即相乘后的分布函数为一个被压缩或者放大的正态分布, S g S_g Sg 为缩放因子, f 1 ( x ) f 2 ( x ) f_1(x)f_2(x) f1(x)f2(x) 的积分等于 S g S_g Sg,它不一定等于1,但 f 1 ( x ) f 2 ( x ) f_1(x)f_2(x) f1(x)f2(x)的方差和均值性质不变。

有关 S g S_g Sg 对该乘积的影响,请参阅文章 两个高斯分布乘积的理论推导 的后半部分。

两个独立的正态分布的和的直觉错误

直觉中,两个正态随机变量的和似乎应该是两个概率密度函数的和,如下图所示,其结果就近似为两个概率密度的包络线,这其实是大错特错的。
在这里插入图片描述

卷积公式

已知两个相互独立的随机变量 X X X Y Y Y,他们的概率密度函数分别为 f X ( x ) ( − ∞ < x < + ∞ ) f_X(x)(-\infty<x<+\infty) fX(x)(<x<+) f Y ( y ) ( − ∞ < y < + ∞ ) f_Y(y)(-\infty<y<+\infty) fY(y)(<y<+)。则它们的联合随机变量 ( X , Y ) (X,Y) (X,Y)的概率密度 f ( x , y ) = f X ( x ) f Y ( y ) f(x,y) = f_X(x)f_Y(y) f(x,y)=fX(x)fY(y)(这是两个连续型随机变量相互独立的充要条件)。

Z = X + Y Z= X + Y Z=X+Y 的分布函数:
F Z ( z ) = P { X + Y ≤ z } = ∬ x + y ≤ z f ( x , y ) d x d y = ∫ − ∞ + ∞ d x ∫ − ∞ z − x f ( x , y ) d y ( 或 ∫ − ∞ + ∞ d y ∫ − ∞ z − y f ( x , y ) d x ) = ∫ − ∞ z − x d y ∫ − ∞ + ∞ f ( x , y ) d x ( 或 ∫ − ∞ z − y d x ∫ − ∞ + ∞ f ( x , y ) d y ) \begin{align*} F_Z(z) &= P\{X+Y \leq z\} \\ &= \iint_{x+y\leq z} f(x, y) dx dy \\ &= \int_{-\infty}^{+\infty}dx \int_{-\infty}^{z-x}f(x,y) dy (或\int_{-\infty}^{+\infty}dy \int_{-\infty}^{z-y}f(x,y) dx ) \\ & = \int_{-\infty}^{z-x} dy \int_{-\infty}^{+\infty} f(x,y) dx (或 \int_{-\infty}^{z-y} dx \int_{-\infty}^{+\infty} f(x,y) dy) \end{align*} FZ(z)=P{X+Yz}=x+yzf(x,y)dxdy=+dxzxf(x,y)dy(+dyzyf(x,y)dx)=zxdy+f(x,y)dx(zydx+f(x,y)dy)
Z = X + Y Z=X+Y Z=X+Y的概率密度函数:
f Z ( z ) = F Z ′ ( z ) = ∫ − ∞ + ∞ f ( x , z − x ) d x ( 或 ∫ − ∞ + ∞ f ( z − y , y ) d y ) \begin{align*} f_Z(z) = F'_Z(z) &= \int_{-\infty}^{+\infty} f(x,z-x)dx(或 \int_{-\infty}^{+\infty}f(z-y,y)dy) \end{align*} fZ(z)=FZ(z)=+f(x,zx)dx(+f(zy,y)dy)
X X X Y Y Y相互独立时, f ( x , y ) = f X ( x ) f Y ( y ) f(x,y) = f_X(x)f_Y(y) f(x,y)=fX(x)fY(y),则

f Z ( z ) = ∫ − ∞ + ∞ f X ( x ) f Y ( z − x ) d x 或   f Z ( z ) = ∫ − ∞ + ∞ f X ( z − y ) f Y ( y ) d y \begin{align*} f_Z(z) &= \int_{-\infty}^{+\infty} f_X(x)f_Y(z-x)dx \\ 或\ \ f_Z(z) &= \int_{-\infty}^{+\infty}f_X(z-y)f_Y(y)dy \end{align*} fZ(z)  fZ(z)=+fX(x)fY(zx)dx=+fX(zy)fY(y)dy
以上两个公式称为卷积公式,记为 f Z = f X ∗ f Y f_Z = f_X * f_Y fZ=fXfY

根据卷积公式和乘积公式计算两个独立正态分布的和

N 1 N_1 N1的概率密度函数为 f 1 ( x ) = 1 2 π σ 1 e − ( x − μ 1 ) 2 2 σ 1 2 f_1(x) = \frac{1}{\sqrt{2\pi}\sigma_1}e^{-\frac{(x-\mu_1)^2}{2\sigma_1^2}} f1(x)=2π σ11e2σ12(xμ1)2 N 2 N_2 N2的概率密度函数为 f 2 ( x ) = 1 2 π σ 2 e − ( x − μ 2 ) 2 2 σ 2 2 f_2(x) = \frac{1}{\sqrt{2\pi}\sigma_2}e^{-\frac{(x-\mu_2)^2}{2\sigma_2^2}} f2(x)=2π σ21e2σ22(xμ2)2,则根据卷积公式, N = N 1 + N 2 N=N_1+N_2 N=N1+N2 的概率密度 f ( z = x + y ) f(z=x+y) f(z=x+y)为:
f ( z ) = ∫ − ∞ + ∞ f 1 ( x ) f 2 ( z − x ) d x = ∫ − ∞ + ∞ 1 2 π σ 1 e − ( x − μ 1 ) 2 2 σ 1 2 ⋅ 1 2 π σ 2 e − ( z − x − μ 2 ) 2 2 σ 2 2 d x \begin{align*} f(z) &= \int_{-\infty}^{+\infty} f_1(x)f_2(z-x) dx \\ &= \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}\sigma_1}e^{-\frac{(x-\mu_1)^2}{2\sigma_1^2}}\cdot \frac{1}{\sqrt{2\pi}\sigma_2}e^{-\frac{(z-x-\mu_2)^2}{2\sigma_2^2}}dx \end{align*} f(z)=+f1(x)f2(zx)dx=+2π σ11e2σ12(xμ1)22π σ21e2σ22(zxμ2)2dx
记:
f 2 ′ ( x ) = 1 2 π σ 2 e − ( z − x − μ 2 ) 2 2 σ 2 2 = 1 2 π σ 2 e − [ x − ( z − μ 2 ) ] 2 2 σ 2 2 \begin{align*} f_2'(x) &= \frac{1}{\sqrt{2\pi}\sigma_2}e^{-\frac{(z-x-\mu_2)^2}{2\sigma_2^2}} = \frac{1}{\sqrt{2\pi}\sigma_2}e^{-\frac{[x-(z-\mu_2)]^2}{2\sigma_2^2}} \end{align*} f2(x)=2π σ21e2σ22(zxμ2)2=2π σ21e2σ22[x(zμ2)]2
不难看出 f 2 ′ ( x ) f_2'(x) f2(x)对应的随机变量 N 2 ′ ∼ ( z − μ 2 , σ 2 2 ) N_2'\sim(z-\mu_2,\sigma_2^2) N2(zμ2,σ22)(这里的 f 2 ′ ( x ) f_2'(x) f2(x) N 2 ′ N_2' N2不需要追问它的实际意义,只是为了帮助理解运用正态分布乘积公式)

f 1 ( x ) ⋅ f 2 ′ ( x ) = S g ⋅ 1 2 π σ e − ( x − μ ) 2 σ 2 其中  S g = 1 2 π ( σ 1 2 + σ 2 2 ) ⋅ e − [ z − ( μ 1 + μ 2 ) ] 2 2 ( σ 1 2 + σ 2 2 ) 则  f ( z ) = ∫ − ∞ + ∞ f 1 ( x ) ⋅ f 2 ′ ( x ) d x = ∫ − ∞ + ∞ S g ⋅ 1 2 π σ e − ( x − μ ) 2 σ 2 d x = S g ⋅ ∫ − ∞ + ∞ 1 2 π σ e − ( x − μ ) 2 σ 2 d x = S g = 1 2 π ( σ 1 2 + σ 2 2 ) ⋅ e − [ z − ( μ 1 + μ 2 ) ] 2 2 ( σ 1 2 + σ 2 2 ) \begin{align*} f_1(x)\cdot f_2'(x) &= S_g \cdot \frac{1}{\sqrt{2\pi}\sigma} e^{- \frac{(x-\mu)^2}{\sigma^2}} \\ 其中\ S_g &= \frac{1}{\sqrt{2\pi(\sigma_1^2+\sigma_2^2)}} \cdot e^{- \frac{[z-(\mu_1+\mu_2)]^2}{2(\sigma_1^2+\sigma_2^2)}} \\ 则\ f(z) &= \int_{-\infty}^{+\infty}f_1(x)\cdot f_2'(x) dx\\ &=\int_{-\infty}^{+\infty} S_g\cdot \frac{1}{\sqrt{2\pi}\sigma} e^{- \frac{(x-\mu)^2}{\sigma^2}} dx\\ &=S_g\cdot \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}\sigma} e^{- \frac{(x-\mu)^2}{\sigma^2}} dx\\ &= S_g \\ &= \frac{1}{\sqrt{2\pi(\sigma_1^2+\sigma_2^2)}} \cdot e^{- \frac{[z-(\mu_1+\mu_2)]^2}{2(\sigma_1^2+\sigma_2^2)}} \end{align*} f1(x)f2(x)其中 Sg f(z)=Sg2π σ1eσ2(xμ)2=2π(σ12+σ22) 1e2(σ12+σ22)[z(μ1+μ2)]2=+f1(x)f2(x)dx=+Sg2π σ1eσ2(xμ)2dx=Sg+2π σ1eσ2(xμ)2dx=Sg=2π(σ12+σ22) 1e2(σ12+σ22)[z(μ1+μ2)]2
也就是 N = N 1 + N 2 ∼ N ( μ 1 + μ 2 , σ 1 2 + σ 2 2 ) N=N_1+N_2 \sim N(\mu_1+\mu_2,\sigma_1^2+\sigma_2^2) N=N1+N2N(μ1+μ2,σ12+σ22)

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐