条件独立5条重要性质及其证明

在这里插入图片描述

条件独立

V = { V 1 , V 2 , …   } V = \{V_1, V_2, \dots\} V={V1,V2,} 表示变量的有限集合。设 P ( ⋅ ) P(\sdot) P() V V V 中变量的联合概率分布函数。 X , Y , Z , W X, Y, Z, W X,Y,Z,W 表示 V V V 中变量的子集,即 X , Y , Z , W ∈ V X, Y, Z, W \in V X,Y,Z,WV。当给定 Z Z Z 时,如果
P ( x ∣ y , z ) = P ( x ∣ z ) P ( y , z ) > 0 P(x \mid y, z) = P(x \mid z)\quad\quad P(y, z) \gt 0 P(xy,z)=P(xz)P(y,z)>0
X , Y X, Y X,Y 条件独立。

我们用符号 ( X ⊥  ⁣ ⁣ ⁣ ⊥ Y ∣ Z ) (X {\perp\!\!\!\perp} Y \mid Z) (XYZ) 表示条件独立,即
( X ⊥  ⁣ ⁣ ⁣ ⊥ Y ∣ Z )    ⟺    P ( x ∣ y , z ) = P ( x ∣ z ) (X {\perp\!\!\!\perp} Y \mid Z) \iff P(x \mid y, z) = P(x \mid z) (XYZ)P(xy,z)=P(xz)
条件独立有5条重要的性质:

对称性: ( X ⊥  ⁣ ⁣ ⁣ ⊥ Y ∣ Z )    ⟹    ( X ⊥  ⁣ ⁣ ⁣ ⊥ Y ∣ Z ) (X {\perp\!\!\!\perp} Y \mid Z) \implies (X {\perp\!\!\!\perp} Y \mid Z) (XYZ)(XYZ)

( X ⊥  ⁣ ⁣ ⁣ ⊥ Y ∣ Z )    ⟺    P ( x ∣ y , z ) = P ( x ∣ z ) (1) \tag{1}(X {\perp\!\!\!\perp} Y \mid Z) \iff P(x \mid y,z)=P(x \mid z) (XYZ)P(xy,z)=P(xz)(1)
( Y ⊥  ⁣ ⁣ ⁣ ⊥ X ∣ Z )    ⟺    P ( y ∣ x , z ) = P ( y ∣ z ) (2) \tag{2}(Y {\perp\!\!\!\perp} X \mid Z) \iff P(y \mid x,z)=P(y \mid z) (YXZ)P(yx,z)=P(yz)(2)

利用乘法公式,1式和2式可以改写为:
P ( x , y , z ) P ( y , z ) = P ( x , z ) P ( z ) (3) \tag{3}\frac {P(x,y,z)} {\boxed{P(y,z)}} = \frac {\boxed{P(x,z)}} {P(z)} P(y,z)P(x,y,z)=P(z)P(x,z)(3)

P ( x , y , z ) P ( x , z ) = P ( y , z ) P ( z ) (4) \tag{4}\frac {P(x,y,z)} {P(x,z)} = \frac {P(y,z)} {P(z)} P(x,z)P(x,y,z)=P(z)P(y,z)(4)

3式方框标注部分位置对换一下,就是4式。 ■ \quad\blacksquare

分解性: ( X ⊥  ⁣ ⁣ ⁣ ⊥ Y W ∣ Z )    ⟹    ( X ⊥  ⁣ ⁣ ⁣ ⊥ Y ∣ Z ) (X {\perp\!\!\!\perp} YW \mid Z) \implies (X {\perp\!\!\!\perp} Y \mid Z) (XYWZ)(XYZ)

( X ⊥  ⁣ ⁣ ⁣ ⊥ Y W ∣ Z )    ⟺    P ( x ∣ y , z , w ) = P ( x ∣ z ) (1) \tag{1}(X {\perp\!\!\!\perp} YW \mid Z) \iff P(x \mid y,z,w) = P(x \mid z) (XYWZ)P(xy,z,w)=P(xz)(1)
( X ⊥  ⁣ ⁣ ⁣ ⊥ Y ∣ Z )    ⟺    P ( x ∣ y , z ) = P ( x ∣ z ) (2) \tag{2}(X {\perp\!\!\!\perp} Y \mid Z) \iff P(x \mid y,z) = P(x \mid z) (XYZ)P(xy,z)=P(xz)(2)

根据公式: P ( A ∣ K ) = ∑ i P ( A ∣ B i , K ) P ( B i ∣ K ) P(A \mid K) = \displaystyle{\sum_{i} P(A \mid B_i, K)P(B_i \mid K)} P(AK)=iP(ABi,K)P(BiK)
P ( x ∣ y , z ) = ∑ w ∈ W P ( x ∣ y , z , w ) P ( w ∣ y , z ) (3) \tag{3}P(x \mid y,z) = \sum_{w \in W} P(x \mid y,z,w)P(w \mid y,z) P(xy,z)=wWP(xy,z,w)P(wy,z)(3)
根据1式, P ( x ∣ y , z , w ) = P ( x ∣ z ) P(x \mid y,z,w)=P(x \mid z) P(xy,z,w)=P(xz),带入3式得:
P ( x ∣ y , z ) = ∑ w ∈ W P ( x ∣ z ) P ( w ∣ y , z ) = P ( x ∣ z ) ∑ w ∈ W P ( w ∣ y , z ) (4) \tag{4}P(x \mid y,z) = \sum_{w \in W} P(x \mid z)P(w \mid y,z) = P(x \mid z) \sum_{w \in W}P(w \mid y,z) P(xy,z)=wWP(xz)P(wy,z)=P(xz)wWP(wy,z)(4)

因为对任意 ∀ w ∈ W \forall w \in W wW的情况都取到了,所以 ∑ w ∈ W P ( w ∣ y , z ) \displaystyle{\sum_{w \in W}P(w \mid y,z)} wWP(wy,z)求和的结果就是1:
∴ P ( x ∣ y , z ) = P ( x ∣ z ) ■ (5) \therefore \tag{5}P(x \mid y,z) = P(x \mid z) \quad \blacksquare P(xy,z)=P(xz)(5)

弱连性: ( X ⊥  ⁣ ⁣ ⁣ ⊥ Y W ∣ Z )    ⟹    ( X ⊥  ⁣ ⁣ ⁣ ⊥ Y ∣ Z W ) (X {\perp\!\!\!\perp} Y W\mid Z) \implies (X {\perp\!\!\!\perp} Y \mid ZW) (XYWZ)(XYZW)

( X ⊥  ⁣ ⁣ ⁣ ⊥ Y W ∣ Z )    ⟺    P ( x ∣ y , z , w ) = P ( x ∣ z ) (1) \tag{1}(X {\perp\!\!\!\perp} YW \mid Z) \iff P(x \mid y,z,w)=P(x \mid z) (XYWZ)P(xy,z,w)=P(xz)(1)
( X ⊥  ⁣ ⁣ ⁣ ⊥ Y ∣ Z W )    ⟺    P ( x ∣ y , z , w ) = P ( x ∣ z , w ) (2) \tag{2}(X {\perp\!\!\!\perp} Y \mid ZW) \iff P(x \mid y,z,w)=P(x \mid z,w) (XYZW)P(xy,z,w)=P(xz,w)(2)

根据公式: P ( A ∣ K ) = ∑ i P ( A ∣ B i , K ) P ( B i ∣ K ) P(A \mid K) = \displaystyle{\sum_{i} P(A \mid B_i, K)P(B_i \mid K)} P(AK)=iP(ABi,K)P(BiK)
P ( x ∣ z , w ) = ∑ y ∈ Y P ( x ∣ y , z , w ) P ( y ∣ z , w ) (3) \tag{3}P(x \mid z,w) = \sum_{y \in Y} P(x \mid y,z,w)P(y \mid z,w) P(xz,w)=yYP(xy,z,w)P(yz,w)(3)
根据1式 P ( x ∣ y , z , w ) = P ( x ∣ z ) P(x \mid y,z,w)=P(x \mid z) P(xy,z,w)=P(xz),带入3式得:
P ( x ∣ z , w ) = ∑ y ∈ Y P ( x ∣ z ) P ( y ∣ z , w ) = P ( x ∣ z ) ∑ y ∈ Y P ( y ∣ z , w ) (4) \tag{4}P(x \mid z,w) = \sum_{y \in Y} P(x \mid z)P(y \mid z,w) = P(x \mid z) \sum_{y \in Y} P(y \mid z,w) P(xz,w)=yYP(xz)P(yz,w)=P(xz)yYP(yz,w)(4)

因为对任意 ∀ y ∈ Y \forall y \in Y yY的情况都取到了,所以 ∑ y ∈ Y P ( y ∣ z , w ) = 1 \displaystyle\sum_{y \in Y} {P(y \mid z,w)} = 1 yYP(yz,w)=1
∴ P ( x ∣ z , w ) = P ( x ∣ z ) = P ( x ∣ y , z , w ) ■ \therefore P(x \mid z,w) = P(x \mid z) = P(x \mid y,z,w) \quad \blacksquare P(xz,w)=P(xz)=P(xy,z,w)

缩并性: ( X ⊥  ⁣ ⁣ ⁣ ⊥ Y ∣ Z ) & ( X ⊥  ⁣ ⁣ ⁣ ⊥ W ∣ Z Y )    ⟹    ( X ⊥  ⁣ ⁣ ⁣ ⊥ Y W ∣ Z ) (X {\perp\!\!\!\perp} Y \mid Z) \& (X {\perp\!\!\!\perp} W \mid ZY) \implies (X {\perp\!\!\!\perp} YW \mid Z) (XYZ)&(XWZY)(XYWZ)

{ ( X ⊥  ⁣ ⁣ ⁣ ⊥ Y ∣ Z )    ⟺    P ( x ∣ y , z ) = P ( x ∣ z ) (1) ( X ⊥  ⁣ ⁣ ⁣ ⊥ W ∣ Z Y )    ⟺    P ( x ∣ y , z , w ) = P ( x ∣ y , z ) (2) \begin{cases} (X {\perp\!\!\!\perp} Y \mid Z) &\iff P(x \mid y,z)=P(x \mid z) &\text{(1)}\\ (X {\perp\!\!\!\perp} W \mid ZY) &\iff P(x \mid y,z,w)=P(x \mid y,z)&\text{(2)} \end{cases} {(XYZ)(XWZY)P(xy,z)=P(xz)P(xy,z,w)=P(xy,z)(1)(2)

要证明:
( X ⊥  ⁣ ⁣ ⁣ ⊥ Y W ∣ Z )    ⟺    P ( x ∣ y , z , w ) = P ( x ∣ z ) (3) \tag{3}(X {\perp\!\!\!\perp} YW \mid Z) \iff P(x \mid y,z,w)=P(x \mid z) (XYWZ)P(xy,z,w)=P(xz)(3)
1式左边和2式右边相同,两式一合并:
P ( x ∣ y , z , w ) = P ( x ∣ z ) (4) \tag{4}P(x \mid y,z,w) = P(x \mid z) P(xy,z,w)=P(xz)(4)
4式就是要证明的3式。 ■ \blacksquare

相交性: ( X ⊥  ⁣ ⁣ ⁣ ⊥ W ∣ Z Y ) & ( X ⊥  ⁣ ⁣ ⁣ ⊥ Y ∣ Z W )    ⟹    ( X ⊥  ⁣ ⁣ ⁣ ⊥ Y W ∣ Z ) (X {\perp\!\!\!\perp} W \mid ZY) \& (X {\perp\!\!\!\perp} Y \mid ZW) \implies (X {\perp\!\!\!\perp} YW \mid Z) (XWZY)&(XYZW)(XYWZ)

{ ( X ⊥  ⁣ ⁣ ⁣ ⊥ W ∣ Z Y )    ⟺    P ( x ∣ y , z , w ) = P ( x ∣ y , z ) (1) ( X ⊥  ⁣ ⁣ ⁣ ⊥ Y ∣ Z W )    ⟺    P ( x ∣ y , z , w ) = P ( x ∣ z , w ) (2) \begin{cases} (X {\perp\!\!\!\perp} W \mid ZY) \iff P(x \mid y,z,w)=P(x \mid y,z) &\text{(1)}\\ (X {\perp\!\!\!\perp} Y \mid ZW) \iff P(x \mid y,z,w)=P(x \mid z,w) &\text{(2)} \end{cases} {(XWZY)P(xy,z,w)=P(xy,z)(XYZW)P(xy,z,w)=P(xz,w)(1)(2)

要证明:
( X ⊥  ⁣ ⁣ ⁣ ⊥ Y W ∣ Z )    ⟺    P ( x ∣ y , z , w ) = P ( x ∣ z ) (3) \tag{3}(X {\perp\!\!\!\perp} YW \mid Z) \iff P(x \mid y,z,w)=P(x \mid z) (XYWZ)P(xy,z,w)=P(xz)(3)
1式2式左边相同,两式一合并:
P ( x ∣ y , z ) = P ( x ∣ z , w ) (4) \tag{4}P(x \mid y,z) = P(x \mid z,w) P(xy,z)=P(xz,w)(4)

利用乘法公式,4式可写做:
P ( x , y , z ) P ( y , z ) = P ( x , z , w ) P ( z , w ) (5) \tag{5}\frac {P(x,y,z)} {\boxed{P(y,z)}} = \frac {\boxed{P(x,z,w)}} {P(z,w)} P(y,z)P(x,y,z)=P(z,w)P(x,z,w)(5)
交换5式方框部分,并对 Y Y Y进行边缘化:
∑ Y P ( x , y , z ) P ( x , z , w ) = ∑ Y P ( y , z ) P ( z , w ) (6) \tag{6}\frac {\displaystyle\sum_{Y} P(x,y,z)} {P(x,z,w)} = \frac {\displaystyle\sum_{Y} P(y,z)} {P(z,w)} P(x,z,w)YP(x,y,z)=P(z,w)YP(y,z)(6)
根据全概率公式,得:
P ( x , z ) P ( x , z , w ) = P ( z ) P ( z , w ) (7) \tag{7}\frac {P(x,z)} {\boxed{P(x,z,w)}} = \frac {\boxed{P(z)}} {P(z,w)} P(x,z,w)P(x,z)=P(z,w)P(z)(7)

交换方框部分,得
P ( x , z ) P ( z ) = P ( x , z , w ) P ( z , w ) (8) \tag{8}\frac {P(x,z)} {P(z)} = \frac {P(x,z,w)} {P(z,w)} P(z)P(x,z)=P(z,w)P(x,z,w)(8)
将8式写成条件概率
P ( x ∣ z ) = P ( x ∣ z , w ) (9) \tag{9}P(x \mid z)=P(x \mid z,w) P(xz)=P(xz,w)(9)
9式和2式一合并,即可得: P ( x ∣ y , z , w ) = P ( x ∣ z ) P(x \mid y,z,w)=P(x \mid z) P(xy,z,w)=P(xz),这就是我们要证明的3式。 ■ \blacksquare

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐