概率论 —— 随机变量的数字特征
文章目录一、一维随机变量的数字特征1. 数学期望(1)概念定义(2)说明(3)性质2. 方差、标准差(1)概念(2)性质3. 切比雪夫不等式二、二维随机变量的数字特征1. 数学期望2. 协方差与相关系数(1)概念(2) 性质三、独立性与相关性的判定一、一维随机变量的数字特征1. 数学期望(1)概念定义如果 XXX 是离散型随机变量,其分布列为 pi=P{X=xi}(i=1,2,...)p_i =
文章目录
一、一维随机变量的数字特征
1. 数学期望
(1)概念定义
-
如果 X X X 是离散型随机变量,其分布列为 p i = P { X = x i } ( i = 1 , 2 , . . . ) p_i = P\{X=x_i\}(i=1,2,...) pi=P{X=xi}(i=1,2,...), Y Y Y 是 X X X 的函数, Y = g ( X ) Y = g(X) Y=g(X)
- 若级数 ∑ i = 1 ∞ x i p i \sum\limits_{i=1}^\infin x_ip_i i=1∑∞xipi绝对收敛,则称随机变量 X X X 的数学期望存在,并将级数和 ∑ i = 1 ∞ x i p i \sum\limits_{i=1}^\infin x_ip_i i=1∑∞xipi 称为随机变量的数学期望,记为 E ( X ) 或 E X E(X) 或 EX E(X)或EX,即 E ( X ) = ∑ i = 1 ∞ x i p i E(X) = \sum\limits_{i=1}^\infin x_ip_i E(X)=i=1∑∞xipi 否则称 X X X 的数学期望不存在;
- 若级数 ∑ i = 1 ∞ g ( x i ) p i \sum\limits_{i=1}^\infin g(x_i)p_i i=1∑∞g(xi)pi 绝对收敛,则称 Y = g ( x ) Y = g(x) Y=g(x) 的数学期望 E [ g ( X ) ] E[g(X)] E[g(X)] 存在,且 E [ g ( X ) ] = ∑ i = 1 ∞ g ( x i ) p i E[g(X)] = \sum\limits_{i=1}^\infin g(x_i)p_i E[g(X)]=i=1∑∞g(xi)pi,否则称 g ( X ) g(X) g(X) 的数学期望不存在
-
如果 X X X 是连续型随机变量,其概率密度为 f ( x ) f(x) f(x), Y Y Y 是 X X X 的函数, Y = g ( X ) Y = g(X) Y=g(X)
-
若积分 ∫ − ∞ + ∞ x f ( x ) d x \int_{-\infin}^{+\infin} xf(x)dx ∫−∞+∞xf(x)dx 绝对收敛,则称 X X X 的数学期望存在,且 E X = ∫ − ∞ + ∞ x f ( x ) d x EX=\int_{-\infin}^{+\infin} xf(x)dx EX=∫−∞+∞xf(x)dx,否则称 X X X 的数学期望不存在。
-
若积分 ∫ − ∞ + ∞ g ( x ) f ( x ) d x \int_{-\infin}^{+\infin} g(x)f(x)dx ∫−∞+∞g(x)f(x)dx 绝对收敛,则称 g ( X ) g(X) g(X) 的数学期望存在,且 E [ g ( X ) ] = ∫ − ∞ + ∞ g ( x ) f ( x ) d x E[g(X)]=\int_{-\infin}^{+\infin} g(x)f(x)dx E[g(X)]=∫−∞+∞g(x)f(x)dx,否则称 g ( X ) g(X) g(X) 的数学期望不存在。
-
(2)说明
数学期望
又称为概率平均值
,常常简称期望
或均值
。数学期望是描述随机变量平均取值状况特征的指标,它刻画随机变量的一切可能值的集中位置- 在数学期望的定义中要求级数(或积分)绝对收敛,否则称期望不存在。这是因为 X X X 的期望存在要求与 X X X 的取值顺序无关,即要求任意改变 x i x_i xi 的次序不应改变 E X EX EX 的存在性,这在数学上就要求级数(或积分)绝对收敛,况且绝对收敛又有很多性质也便于数学上的处理。
(3)性质
-
对任意常数 a a a 和随机变量 X i ( i = 1 , 2 , . . . , n ) X_i(i=1,2,...,n) Xi(i=1,2,...,n) 有 E ( ∑ i = 1 n a i X i ) = ∑ i = 1 n a i E X i E(\sum \limits_{i=1}^na_iX_i) = \sum \limits_{i=1}^na_i EX_i E(i=1∑naiXi)=i=1∑naiEXi
- E c = c Ec = c Ec=c
- E ( a X + c ) = a E X + c E(aX+c) = aEX+c E(aX+c)=aEX+c
- E ( X ± Y ) = E X ± E Y E(X\pm Y) = EX \pm EY E(X±Y)=EX±EY
-
设 X X X 与 Y Y Y 相互独立,则
- E ( X Y ) = E X ⋅ E Y E(XY) = EX ·EY E(XY)=EX⋅EY
- E [ g 1 ( X ) ⋅ g 2 ( Y ) ] = E [ g 1 ( X ) ] ⋅ E [ g 2 ( Y ) ] E[g_1(X) · g_2(Y)] = E[g_1(X)] · E[g_2(Y)] E[g1(X)⋅g2(Y)]=E[g1(X)]⋅E[g2(Y)]
-
一般地,设 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn 相互独立,则
- E ( ∏ i = 1 n X i ) = ∏ i = 1 n E X i E(\prod\limits_{i=1}^nX_i) = \prod\limits_{i=1}^n EX_i E(i=1∏nXi)=i=1∏nEXi
- E [ ∏ i = 1 n g i ( X i ) ] = ∏ i = 1 n E [ g i ( X i ) ] E[\prod\limits_{i=1}^n g_i(X_i)] = \prod\limits_{i=1}^n E[g_i(X_i)] E[i=1∏ngi(Xi)]=i=1∏nE[gi(Xi)]
2. 方差、标准差
(1)概念
-
方差
:设 X X X 是随机变量,如果 E [ ( X − E X ) 2 ] E[(X-EX)^2] E[(X−EX)2] 存在,则称 E [ ( X − E X ) 2 ] E[(X-EX)^2] E[(X−EX)2] 为 X X X 的方差,记为 D X DX DX 或 Var ( X ) \text{Var}(X) Var(X),即 D X = E [ ( X − E X ) 2 ] = E ( X 2 ) − ( E X ) 2 DX = E[(X-EX)^2] = E(X^2)-(EX)^2 DX=E[(X−EX)2]=E(X2)−(EX)2
-
标准差
:称 D X \sqrt{DX} DX 为 X X X 的标准差或均方差,记为 σ ( X ) \sigma(X) σ(X) -
标准化随机变量
:称随机变量 X ∗ = X − E X D X X^* = \frac{X-EX}{\sqrt{DX}} X∗=DXX−EX 为 X X X 的标准化随机变量,有 E X ∗ = 0 , D X ∗ = 1 EX^* = 0,DX^*=1 EX∗=0,DX∗=1
(2)性质
- D X ≥ 0 , E ( X 2 ) = D X + ( E X ) 2 ≥ ( E X ) 2 DX \geq 0,E(X^2) = DX+(EX)^2 \geq (EX)^2 DX≥0,E(X2)=DX+(EX)2≥(EX)2
- D c = 0 Dc=0 Dc=0 (c为常数)
- D ( a X + b ) = a 2 D X D(aX+b) = a^2DX D(aX+b)=a2DX
- D ( X ± Y ) = D X + D Y + 2 C o v ( X , Y ) D(X \pm Y) = DX+DY+2Cov(X,Y) D(X±Y)=DX+DY+2Cov(X,Y)
- 若
X
X
X 和
Y
Y
Y 相互独立,则
D ( a X + b Y ) = a 2 D X + b 2 D Y D(aX+bY) = a^2DX + b^2DY D(aX+bY)=a2DX+b2DY
一般地,如果 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn 相互独立, g i ( x ) g_i(x) gi(x) 为 x x x 的连续函数,则
D ( ∑ i = 1 n a i X i ) = ∑ i = 1 n a i 2 D X i D [ ∑ i = 1 n g i ( X i ) ] = ∑ i = 1 n D [ g i ( X i ) ] D(\sum\limits_{i=1}^n a_iX_i) = \sum\limits_{i=1}^n a_i^2DX_i \\ D[\sum\limits_{i=1}^n g_i(X_i)] = \sum\limits_{i=1}^n D[g_i(X_i)] D(i=1∑naiXi)=i=1∑nai2DXiD[i=1∑ngi(Xi)]=i=1∑nD[gi(Xi)]
3. 切比雪夫不等式
-
如果随机变量 X X X 的方差 D X DX DX 存在,则对任意 ϵ > 0 \epsilon>0 ϵ>0,有
P { ∣ X − E X ∣ ≥ ϵ } ≤ D X ϵ 2 P\{|X-EX|\geq\epsilon\} \leq \frac{DX}{\epsilon^2} P{∣X−EX∣≥ϵ}≤ϵ2DX
-
由切比雪夫不等式知,当 D X DX DX 愈小时,概率 P { ∣ X − E X ∣ < ϵ } P\{|X-EX|<\epsilon\} P{∣X−EX∣<ϵ} 越大,这表明方差是刻画随机变量与其期望值偏离程度的量,是描述随机变量 X X X “分散程度” 特征的指标
-
常用分布的期望和方差
二、二维随机变量的数字特征
1. 数学期望
- 设 X , Y X,Y X,Y 为随机变量, g ( X , Y ) g(X,Y) g(X,Y) 为 X , Y X,Y X,Y 的函数
- 如果
(
X
,
Y
)
(X,Y)
(X,Y) 为离散型随机变量,其联合分布为
p i j = P { X = x i , Y = y i } ( i , j = 1 , 2 , . . . ) p_{ij} = P\{X = x_i,Y=y_i\}(i,j=1,2,...) pij=P{X=xi,Y=yi}(i,j=1,2,...)
若级数 ∑ i ∑ j g ( x i , y i ) p i j \sum\limits_{i}\sum\limits_{j}g(x_i,y_i)p_{ij} i∑j∑g(xi,yi)pij 绝对收敛,则定义
E [ g ( X , Y ) ] = ∑ i ∑ j g ( x i , y i ) p i j E[g(X,Y)] = \sum\limits_{i}\sum\limits_{j}g(x_i,y_i)p_{ij} E[g(X,Y)]=i∑j∑g(xi,yi)pij - 如果
(
X
,
Y
)
(X,Y)
(X,Y) 为连续型随机变量,其概率密度为
f
(
x
,
y
)
f(x,y)
f(x,y),若积分
∫
−
∞
+
∞
∫
−
∞
+
∞
g
(
x
,
y
)
f
(
x
,
y
)
d
x
d
y
\int_{-\infin}^{+\infin}\int_{-\infin}^{+\infin} g(x,y)f(x,y)dxdy
∫−∞+∞∫−∞+∞g(x,y)f(x,y)dxdy 绝对收敛,则定义
E [ g ( X , Y ) ] = ∫ − ∞ + ∞ ∫ − ∞ + ∞ g ( x , y ) f ( x , y ) d x d y E[g(X,Y)] = \int_{-\infin}^{+\infin}\int_{-\infin}^{+\infin} g(x,y)f(x,y)dxdy E[g(X,Y)]=∫−∞+∞∫−∞+∞g(x,y)f(x,y)dxdy
2. 协方差与相关系数
(1)概念
-
如果随机变量 X X X 与 Y Y Y 的方差存在且 D x > 0 , D Y > 0 Dx > 0,DY>0 Dx>0,DY>0,则称 E [ ( X − E X ) ( Y − E Y ) ] E[(X-EX)(Y-EY)] E[(X−EX)(Y−EY)] 为随机变量 X X X 与 Y Y Y 的
协方差
,记为 C o v ( X , Y ) Cov(X,Y) Cov(X,Y),即
C o v ( X , Y ) = E [ ( X − E X ) ( Y − E Y ) ] = E ( X Y ) − E X ⋅ E Y Cov(X,Y) = E[(X-EX)(Y-EY)]=E(XY)-EX · EY Cov(X,Y)=E[(X−EX)(Y−EY)]=E(XY)−EX⋅EY
其中 E ( X Y ) = { ∑ i ∑ j x i y j P ( X = x i , Y = y j ) ( 离 散 型 ) , ∫ − ∞ + ∞ ∫ − ∞ + ∞ x y f ( x , y ) d x d y ( 连 续 型 ) E(XY)=\left\{\begin{aligned} &\sum\limits_{i}\sum\limits_{j} x_iy_jP(X=x_i,Y=y_j) (离散型), \\ &\int_{-\infin}^{+\infin}\int_{-\infin}^{+\infin}xyf(x,y)dxdy (连续型) \end{aligned} \right. E(XY)=⎩⎪⎪⎪⎨⎪⎪⎪⎧i∑j∑xiyjP(X=xi,Y=yj)(离散型),∫−∞+∞∫−∞+∞xyf(x,y)dxdy(连续型)
称 ρ X Y = C o v ( X , Y ) D X D Y \rho_{XY} = \frac{Cov(X,Y)}{\sqrt{DX}\sqrt{DY}} ρXY=DXDYCov(X,Y) 为随机变量 X X X 与 Y Y Y 的
相关系数
,若为0则称 X X X 与 Y Y Y 不相关;否则称相关 -
说明
- 协方差 C o v ( X , Y ) Cov(X,Y) Cov(X,Y) 描述随机变量 X X X 和 Y Y Y 间关联程度,比如研究父亲身高 X X X 与孩子身高之间的偏 Y Y Y 的偏差程度,便可用 C o v ( X , Y Cov(X,Y Cov(X,Y) 来刻画
- 相关系数 ρ X Y \rho_{XY} ρXY 描述随机变量 X X X 和 Y Y Y 之间的线性相依性, ∣ ρ X Y ∣ |\rho_{XY}| ∣ρXY∣ 的大小是刻画 X X X 和 Y Y Y 之间的线性相关程度的一种度量。 ρ X Y = 0 \rho_{XY}=0 ρXY=0 表示 X X X 和 Y Y Y 之间不存在线性关系,故称 X X X 和 Y Y Y 不线性相关,但这并不意味着 X X X 和 Y Y Y 之间不存在相依关系,它们之间还可存在某种非线性关系。
(2) 性质
- 协方差相关性质
(3)深入理解协方差
- 参考:协方差的深入理解
三、独立性与相关性的判定
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)