相关系数对二维正态分布图像的影响

如果把μ1μ2μ1μ2和σ12σ22σ12σ22对图像的影响加入进来，讨论要复杂一些，但是ρ\rhoρ对图像的影响的基本方向不会变，有集中程度和对称中心两方面的影响。其实μ1μ2μ1μ2也不过是把图像的对称中心从00(0,0)00转移到了μ1μ2μ1μ2，而σ1σ2σ1σ2若是不相等，就是ρ0\rho = 0ρ0时的圆环状散点图会变成椭圆环状散点图，之后将ρ。

kikato2022

2348人浏览 · 2023-12-01 12:16:42

kikato2022 · 2023-12-01 12:16:42 发布

二维正态分布的表达式：
$f(x,y)=\frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}\exp\{-\frac{1}{2(1-\rho^2)}[\frac{(x-\mu_1)^2}{\sigma_1^2}-\frac{2\rho(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}]\}$
其中 $\mu_1,\mu_2$ 为均值， $\sigma_1^2,\sigma_2^2$ 为方差， $\rho$ 为相关系数，且 $-1<\rho<1$ 。

先用一些大致的图像来感受相关系数对二维正态分布的影响

三维立体图

在这里插入图片描述

散点图

在这里插入图片描述

从图象上我们大致可以看出，当 $\rho$ 从 $0$ 向无限接近于 $1$ 变化的过程中，图像越来越向直线 $y = x$ 集中；当 $\rho$ 从 $0$ 向无限接近于 $- 1$ 变化的过程中，图像越来越向直线 $y = - x$ 集中。这与我们对相关系数的认识是一致的。那么，现在我们从表达式的角度来分析，相关系数为什么会对图像带来这样的影响。

对表达式进行分析

为了分析简单，我采用控制变量法，令 $\mu_1=\mu_2=0，\sigma_1=\sigma_2=1$ .
此时有
$\frac{1}{2\pi\sqrt{1-\rho^2}}\exp\{-\frac{1}{2(1-\rho^2)}[x^2-2\rho xy+y^2\}$
我们把式子改写为：
$\begin{align*} f(x,y) &= \frac{1}{2\pi\sqrt{1-\rho^2}}\exp\{-\frac{1}{2(1-\rho^2)}[(x-\rho y)^2+(1-\rho^2) y^2\}\\ &= \frac{e^{-\frac{y^2}{2}}}{2\pi\sqrt{1-\rho^2}} \exp\{-\frac{1}{2(1-\rho^2)}[(x-\rho y)^2\} \end{align*}$
$\rho$ 对图像对称中心的影响
从上式我们可以看出，当 $y$ 取一定的值的时候， $f (x, y)$ 是关于 $x=\rho y$ 对称的，也就是关于 $x$ 的类正态分布（叫类正态分布是因为它的形状和正态分布基本一样，但是前面系数多了个 $e^{-\frac{y^2}{2}}$ ，所以概率密度的积分不唯一）。

若 $\rho=0,y=0$ 图像就退化成 $x$ 的一维正态分布，若 $\rho=0,y=a\neq 0$ , 图像就退化成 $x$ 的类正态分布，但只要 $\rho=0$ ，关于 $x$ 的类正态分布的中心点是不受 $y$ 影响的。

用一句更直接的话说，当固定 $y$ 的值，关于 $x$ 的类正态分布的中心点一定在 $\rho y$ 这条直线上，也就是说，点(X,Y)出现概率最高的点一定在 $x=\rho y$ 这条直线附近。

$\rho$ 对图像集中程度的影响
我们可以看到，上式中 $\rho$ 出现的地方除了在分子 $(x-\rho y)^2$ 中，还出现在了指数的分母和左边系数的分母中,这其实是一维正态分布方差出现的位置，甚至我们可以这样说：

$\frac{1}{2\pi\sqrt{1-\rho^2}} \exp\{-\frac{1}{2(1-\rho^2)}[(x-\rho y)^2\}$

在上面我们抽离出来分析的表达式中， $1-\rho^2$ 起到的是方差的作用，而 $\rho y$ 起到的是均值的作用，所以当 $\rho$ 越接近于0，该表达式的方差越大，关于 $x$ 的正态分布的图像越平，当 $r h o$ 越接近于1，该表达式的方差越接近于0，关于 $x$ 的正态分布的图像越尖。

这基本从表达式的角度说明了，为什么当 $\rho$ 从 0 向 $1 (- 1)$ 变化的过程中，图像从环状的散点图，变成了集中于 $y = x (y = - x)$ 的线状的散点图。

另外由于系数 $\frac{e^{-\frac{y^2}{2}}}{2\pi\sqrt{1-\rho^2}}$ 的中 $e^{-\frac{y^2}{2}}$ 项的存在，位于图像的绝对中心点 $x = 0, y = 0$ 附近出现的概率密度总是最大的。举例来说，固定 $y = 0$ 和固定 $y = 1$ ，关于 $x$ 的类正态分布形状几乎一模一样，但是 $y = 1$ 的图像比 $y = 0$ 的图像矮。这也解释了为什么散点图总是一个椭圆状，而不是长方形状。

总结

如果把 $\mu_1,\mu_2$ 和 $\sigma_1^2,\sigma_2^2$ 对图像的影响加入进来，讨论要复杂一些，但是 $\rho$ 对图像的影响的基本方向不会变，有集中程度和对称中心两方面的影响。其实 $\mu_1，\mu_2$ 也不过是把图像的对称中心从 $(0, 0)$ 转移到了 $(\mu_1,\mu_2)$ ，而 $\sigma_1,\sigma_2$ 若是不相等，就是 $\rho = 0$ 时的圆环状散点图会变成椭圆环状散点图，之后将 $\rho$ 从 $0$ 到 $1 (- 1)$ 进行变化，变化趋势是一样的。至于这个二维正态分布的表达式是怎么推出来的，请看我另外一篇文章。