正态分布（高斯分布）的由来（公式推导）

正态分布的公式是怎么推导出来的

Hanjieee

7626人浏览 · 2022-09-16 14:33:19

Hanjieee · 2022-09-16 14:33:19 发布

1809年，高斯在研究《天体运动理论》的过程中发现其中的误差分布是正态分布。
比较接近原著的推导可以参考：https://zhuanlan.zhihu.com/p/387653090，但原著中高斯的数学直觉太强，有点难以理解，个人认为从以下方式理解更容易理解，故分享。

设误差密度函数为f(x)，有n个独立观测值x1, x2, … , xn，真值为X。f(x)表示误差为x的概率，而误差=观测值-真值。假设每次观测都是独立且随机的，高斯认为误差密度函数f(x)应具有以下特点：

f(x)为连续函数；
x=0 时，f(x)应有最大值；
x→∞ 时，f(x)→0；
从 x=0 开始，f(x)向两侧逐渐趋近于0；
∫ f(x) = 1，即f(x)在实数域R上的积分为1；

以下几点，高斯在原书中没有明确提到，但根据上面5点，可以认为是他的潜在假定：

f(x)关于 x=0 处对称，即 f(x) = f(-x)，是偶函数；
[-∞, 0]，f(x) 单调递增；
[0, +∞]，f(x) 单调递减；
f(x) 恒大于0；
f(x) 在实数域R上处处可导。

极大似然函数为： $L(x) = f(x_1-X)f(x_2-X)...f(x_n-X)$ ，我们希望L(x)最大，此时导数为0，即求令L(x)最大的f(x)。为了方便计算，做对数转换：

$\ln{L(x)} = \sum_{i=1}^{n}\ln{f(x_i-X)}$

再对两边求导：

$\frac{d\ln{L(x)}}{dx} = -\sum_{i=1}^{n} \frac{f^{\prime}(x_i-X)}{f(x_i-X)} = 0$ ，我们希望求L(x)的最大值，所以令其导数为0。

记 $\frac{f^{\prime}(x)}{f(x)}$ ，则 $\sum_{i=1}^{n} g(x_i-X) = 0$ ，根据“高斯关于误差函数的设定”可知，g(x)是实数域R上的奇函数。可将 $\sum_{i=1}^{n} g(x_i-X)$ 看成一个多元函数，现欲求多元函数的极值点，所以希望对所有参数的偏导都为0。此时高斯假设真值X的估计为 $\bar{x}$ ，则有以下方程组：

$g^{\prime}(x_1-\bar{x})(1-\frac{1}{n}) + g^{\prime}(x_2-\bar{x})(-\frac{1}{n}) + ... + g^{\prime}(x_n-\bar{x})(-\frac{1}{n}) = 0$
$g^{\prime}(x_1-\bar{x})(-\frac{1}{n}) + g^{\prime}(x_2-\bar{x})(1-\frac{1}{n}) + ... + g^{\prime}(x_n-\bar{x})(-\frac{1}{n}) = 0$
…
$g^{\prime}(x_1-\bar{x})(-\frac{1}{n}) + g^{\prime}(x_2-\bar{x})(-\frac{1}{n}) + ... + g^{\prime}(x_n-\bar{x})(1-\frac{1}{n}) = 0$