【线性代数07】马尔科夫矩阵和傅里叶矩阵
本篇可以看作对行列式和特征值应用的举例。但我会谈些我感兴趣的部分,即离散信源信道模型和循环矩阵的对角化。
本篇可以看作对行列式和特征值应用的举例。但我会谈些我感兴趣的部分,即离散信源信道模型和循环矩阵的对角化。
马尔科夫矩阵
这个矩阵从概率论中概率的定义生发,因此各元素实际上就是非负的概率值。马尔科夫矩阵(Markov matrix)又称概率矩阵(probability matrix)、转移概率矩阵(transition probability matrix),在英语数学文献中的惯例是用概率的行向量和概率的右随机矩阵,于是参照维基百科上给出定义:
随机矩阵描述了一个有限状态空间 S S S上的马尔科夫链 X t X_t Xt,如果在一个时间步长内从 i i i到 j j j移动的概率为 P r ( j ∣ i ) = P i , j Pr(j|i)=P_{i,j} Pr(j∣i)=Pi,j,随机矩阵 P P P的第 i i i行、第 j j j列元素由 P i , j P_{i,j} Pi,j给出:
P = [ P 1 , 1 P 1 , 2 … P 1 , j … P 1 , S P 2 , 1 P 2 , 2 … P 2 , j … P 2 , S ⋮ ⋮ ⋱ ⋮ ⋱ ⋮ P i , 1 P i , 2 … P i , j … P i , S ⋮ ⋮ ⋱ ⋮ ⋱ ⋮ P S , 1 P S , 2 … P S , j … P S , S ] . {\displaystyle P=\left[{\begin{matrix}P_{1,1}&P_{1,2}&\dots &P_{1,j}&\dots &P_{1,S}\\P_{2,1}&P_{2,2}&\dots &P_{2,j}&\dots &P_{2,S}\\\vdots &\vdots &\ddots &\vdots &\ddots &\vdots \\P_{i,1}&P_{i,2}&\dots &P_{i,j}&\dots &P_{i,S}\\\vdots &\vdots &\ddots &\vdots &\ddots &\vdots \\P_{S,1}&P_{S,2}&\dots &P_{S,j}&\dots &P_{S,S}\\\end{matrix}}\right].}{\displaystyle} P= P1,1P2,1⋮Pi,1⋮PS,1P1,2P2,2⋮Pi,2⋮PS,2……⋱…⋱…P1,jP2,j⋮Pi,j⋮PS,j……⋱…⋱…P1,SP2,S⋮Pi,S⋮PS,S .
性质
一个显而易见的结论是矩阵
P
P
P有特征值
1
1
1(对应的是右随机矩阵,其中每一行求和为1,若每一列求和为1,取转置验证即可,理同) ,即
P
x
=
1
⋅
x
Px=1\cdot x
Px=1⋅x
基于概率的完备性和可列可加性,可以验证,或言之,由于转移的这个过程是必然发生的,因此各概率的和为1。
从一个概率空间转移到另一个概率空间,概率的完备性、非负性、可列可加性仍旧成立。因此如果
A
、
B
A、B
A、B为两个
n
×
n
n\times n
n×n的转移矩阵,则其乘积(概率转移)、幂(自身演化)、算术平均仍旧是转移矩阵,即
A
B
、
A
n
、
A
+
B
2
AB、\ \ A^n、 \ \ \frac{A+B}{2}
AB、 An、 2A+B
让我们来思考下 A n A^n An当 n → ∞ n \rightarrow \infty n→∞时的场景,可证 A A A的最大特征值就是1,其余特征值的绝对值均小于1,因此 A n A^n An其实将趋于由 λ = 1 \lambda=1 λ=1所表征的那个稳态。
离散信源信道模型
学过《信息论》的朋友应该对类似形式的转移矩阵并不陌生,因此我们用一个离散的信源信道模型作为举例。准确地说,信源可描述为一个概率矩阵。所谓信源分布,即各发送信号各自占据一定的发射可能性。 如用行向量
P
X
P_X
PX来描述一个三元等可能性的信源分布,即
P
X
=
[
1
/
3
1
/
3
1
/
3
]
P_X=\begin{bmatrix} 1/3 & 1/3 & 1/3 \end{bmatrix}
PX=[1/31/31/3]
假设我们面临这样一个信道转移模型
则相应的信道转移矩阵为
P
i
j
=
[
0.8
0.2
0.5
0.5
0.2
0.8
]
行
i
(
X
的概率空间
)
→
列
j
(
Y
的概率空间
)
P_{ij}=\begin{bmatrix} 0.8 & 0.2 \\ 0.5 & 0.5 \\ 0.2 & 0.8 \end{bmatrix} \ \ 行i(X的概率空间)→列j(Y的概率空间)
Pij=
0.80.50.20.20.50.8
行i(X的概率空间)→列j(Y的概率空间)
于是有信宿的概率分布为
P
Y
=
P
X
P
i
j
=
[
1
/
3
1
/
3
1
/
3
]
[
0.8
0.2
0.5
0.5
0.2
0.8
]
=
[
0.5
0.5
]
P_Y=P_XP_{ij}=\begin{bmatrix} 1/3 & 1/3 & 1/3 \end{bmatrix}\begin{bmatrix} 0.8 & 0.2 \\ 0.5 & 0.5 \\ 0.2 & 0.8 \end{bmatrix} =\begin{bmatrix} 0.5 & 0.5 \end{bmatrix}
PY=PXPij=[1/31/31/3]
0.80.50.20.20.50.8
=[0.50.5]
但其实我们往往是面临这个问题,求信道的容量
C
C
C为?
C
=
max
[
H
(
Y
)
−
H
(
Y
∣
X
)
]
C=\max [H(Y)-H(Y|X)]
C=max[H(Y)−H(Y∣X)]
而已知
H
(
Y
)
≤
H
(
0.5
,
0.5
)
=
1
比特,
H
(
Y
∣
X
)
≥
H
(
0.2
,
0.8
)
=
0.7219
比特
H(Y) \le H(0.5,0.5)=1比特, \ \ \ H(Y|X) \ge H(0.2,0.8)=0.7219比特
H(Y)≤H(0.5,0.5)=1比特, H(Y∣X)≥H(0.2,0.8)=0.7219比特
而当两式均取等时,对应的信源分布为
P
X
=
[
1
/
2
0
1
/
2
]
P_X=\begin{bmatrix} 1/2 & 0 & 1/2 \end{bmatrix}
PX=[1/201/2]
于是信道容量也就等于
C
=
H
(
0.5
,
0.5
)
−
H
(
0.2
,
0.8
)
=
0.2781
比特
C =H(0.5,0.5)-H(0.2,0.8)=0.2781比特
C=H(0.5,0.5)−H(0.2,0.8)=0.2781比特
这给人的直观感觉是,选取信道的转移概率越偏离0.5越好,等可能性差错的传输是无效的。
傅里叶矩阵
选一组基底
傅里叶变换是信号处理中的经典操作,对照小波变换,其差异即在于所取基函数的不同。那么怎样选取基函数会让人觉得舒服呢?答案之一是选取一组标准正交基。如此,当我们将这些基向量排列在一起组成变换矩阵时,矩阵就会是一个正规矩阵,而其逆就是其共轭转置。
老爷子说了这样一句话,“I need infinitely many, because my space is infinite dimensional.”,也就是说,无穷维的空间要用无穷维的基去描述。那么对于n维空间,其实我们就用n个标准正交基,即
v
=
x
1
q
1
+
x
2
q
2
+
⋯
+
x
i
q
i
+
⋯
+
x
n
q
n
v=x_1q_1+x_2q_2+\cdots+x_iq_i+\cdots+x_nq_n
v=x1q1+x2q2+⋯+xiqi+⋯+xnqn
其中
x
i
x_i
xi表示对应基底
q
i
q_i
qi上的延展系数。如何求得这个系数呢?这就要体现出标准正交性的巧妙了,令两边同乘共轭转置向量即可
q
i
H
v
=
x
1
q
i
H
q
1
+
x
2
q
i
H
q
2
+
⋯
+
x
i
q
i
H
q
i
+
⋯
+
x
n
q
i
H
q
n
=
x
i
q_i^Hv=x_1q_i^Hq_1+x_2q_i^Hq_2+\cdots+x_iq_i^Hq_i+\cdots+x_nq_i^Hq_n=x_i
qiHv=x1qiHq1+x2qiHq2+⋯+xiqiHqi+⋯+xnqiHqn=xi
此时由于彼此正交将得到0,由于自身标准化将得到1,从而方便求得系数
x
i
x_i
xi。
值得说明的是,正交性是十分有用的。在信号分析中,熟悉的傅里叶级数即采用了正交的三角函数作为基底,即 sin ( n x ) \sin(nx) sin(nx)和 cos ( n x ) \cos(nx) cos(nx),可以验证它们在单周期内的积分为0,也即正交,这种正交的思想也是OFDM子载波选取的原则。
傅里叶矩阵
参照维基百科,给出傅里叶矩阵的定义。
N点的离散傅立叶变换可以用一个 n × m n\times m n×m的矩阵乘法来表示,即 X = F x X=Fx X=Fx,其中 x x x是原始的输入信号, X X X是经过离散傅立叶变换得到的输出信号。 一个 n × n n\times n n×n的变换矩阵 F F F可以定义成 F = ( ω i j ) i , j = 0 , … , N − 1 / N F=(\omega ^{{ij}})_{{i,j=0,\ldots ,N-1}}/{\sqrt {N}} F=(ωij)i,j=0,…,N−1/N,即
F = 1 N [ 1 1 1 1 ⋯ 1 1 ω ω 2 ω 3 ⋯ ω N − 1 1 ω 2 ω 4 ω 6 ⋯ ω 2 ( N − 1 ) 1 ω 3 ω 6 ω 9 ⋯ ω 3 ( N − 1 ) ⋮ ⋮ ⋮ ⋮ ⋮ 1 ω N − 1 ω 2 ( N − 1 ) ω 3 ( N − 1 ) ⋯ ω ( N − 1 ) ( N − 1 ) ] {\displaystyle F={\frac {1}{\sqrt {N}}}{\begin{bmatrix}1&1&1&1&\cdots &1\\1&\omega &\omega ^{2}&\omega ^{3}&\cdots &\omega ^{N-1}\\1&\omega ^{2}&\omega ^{4}&\omega ^{6}&\cdots &\omega ^{2(N-1)}\\1&\omega ^{3}&\omega ^{6}&\omega ^{9}&\cdots &\omega ^{3(N-1)}\\\vdots &\vdots &\vdots &\vdots &&\vdots \\1&\omega ^{N-1}&\omega ^{2(N-1)}&\omega ^{3(N-1)}&\cdots &\omega ^{(N-1)(N-1)}\\\end{bmatrix}}} F=N1 1111⋮11ωω2ω3⋮ωN−11ω2ω4ω6⋮ω2(N−1)1ω3ω6ω9⋮ω3(N−1)⋯⋯⋯⋯⋯1ωN−1ω2(N−1)ω3(N−1)⋮ω(N−1)(N−1)
其中
w
w
w定义为
1
1
1的
n
n
n次方根的主值 ,即
w
=
e
−
2
π
i
N
w=e^{\frac{-2\pi i}{N}}
w=eN−2πi
注意到对于某列
j
j
j来说,其列向量为:
q
j
=
[
w
α
×
(
j
−
1
)
]
T
/
N
α
=
0
,
1
,
2
,
⋯
,
N
−
1
q_j=\begin{bmatrix} w^{\alpha \times (j-1)} \end{bmatrix}^T/\sqrt{N} \ \ \ \ \ \alpha=0,1,2,\cdots,N-1
qj=[wα×(j−1)]T/N α=0,1,2,⋯,N−1
此时我们再取另一列
q
j
+
k
q_{j+k}
qj+k,令两者作内积,就有
q
j
+
k
H
q
j
=
1
N
∑
α
=
0
N
−
1
w
α
×
(
j
−
1
)
w
−
α
×
(
j
+
k
−
1
)
=
∑
α
=
0
N
−
1
w
−
α
k
q_{j+k}^Hq_{j}=\frac{1}{N} \sum_{\alpha = 0}^{N-1} w^{\alpha \times (j-1)}w^{-\alpha \times (j+k-1)}= \sum_{\alpha = 0}^{N-1}w^{-\alpha k}
qj+kHqj=N1α=0∑N−1wα×(j−1)w−α×(j+k−1)=α=0∑N−1w−αk
当
k
=
0
k=0
k=0时,即在求自身模值的平方,可知此时内积的结果为1,验证了标准性。
而当
−
k
≠
0
-k \ne 0
−k=0时,可知
w
−
k
w^{-k}
w−k是一个
N
N
N次的单位根,而
α
\alpha
α这个系数起到了在单位圆上旋转的作用 。不如举
−
k
=
1
-k=1
−k=1为例,则此时可以想到当
α
\alpha
α从
0
0
0遍取完
N
−
1
N-1
N−1时,这
N
N
N个结果将重新组成单位圆上
1
1
1的
N
N
N个
N
N
N次单位根。于是问题变成了,为什么这
N
N
N个单位根的和为
0
0
0?在百度百科上给出了这三种解释:
一个基本方法是等比级数的求和,即 ∑ α = 0 ∞ w α = 1 − w N 1 − w = 0 \sum_{\alpha = 0}^{\infty} w^{\alpha} = \frac{1-w^N}{1-w}=0 α=0∑∞wα=1−w1−wN=0
第二个证法是它们在复平面上构成正多边形的顶点,而由对称性可知多边形的重心在原点。最后一个证法利用关于方程根与系数的韦达定理,由分圆方程 x n − 1 x_{n-1} xn−1项但系数为零得出。
无论采用哪种解释,结论是一致的,即
k
≠
0
k \ne 0
k=0时,内积的结果为0,从而验证了正交性。那么,傅里叶矩阵是一个正规矩阵,一个优良的性质就产生了,即
F
−
1
=
F
H
F^{-1}=F^H
F−1=FH
FFT开销 N l o g 2 N / 2 Nlog_2N/2 Nlog2N/2 的说明
先从理论角度说明。在数字信号处理中,我们知道有两种典型思路来完成FFT,一种是时间抽选DIT,另一种是频率抽选DIF,经过一次分序后,两种方法都将减少一半的运算量。
对于DIT而言,对
x
(
n
)
x(n)
x(n)序列的奇偶进行分序,结果输出
X
(
k
)
X(k)
X(k)为前一半后一半。
对于DIF而言,是对
x
(
n
)
x(n)
x(n)序列的前一半后一半进行分序,结果输出
X
(
k
)
X(k)
X(k)分奇和偶。
又知DFT运算的定义为
X
(
k
)
=
∑
n
=
0
N
−
1
x
(
n
)
w
N
n
k
,
k
=
0
,
1
,
⋯
,
N
−
1
X(k)=\sum_{n=0}^{N-1} x(n)w_{N}^{nk}, k = 0,1,\cdots,N-1
X(k)=n=0∑N−1x(n)wNnk,k=0,1,⋯,N−1
在运算中,乘法的运算开销是最大的。对于 N N N点的DFT而言,其矩阵乘法开销为N,一共有N点,开销估计为 N 2 N^2 N2,而FFT使得最终转换成了 l o g 2 N log_2N log2N级的蝶形运算,每级采用蝶形运算后所用的乘法开销均为 N / 2 N/2 N/2(即每两个可共用一次系数,节约一半计算量),从而总开销为 N l o g 2 N / 2 Nlog_2N/2 Nlog2N/2。
现在我们从矩阵变换的视角理解上述过程,来看展示一个64点的FFT转为32点FFT的过程:
F
64
=
[
I
D
32
I
−
D
32
]
[
F
32
0
0
F
32
]
[
1
0
0
0
⋯
0
0
0
0
1
0
⋯
0
0
⋮
⋮
⋮
⋮
⋱
⋮
⋮
0
0
0
0
⋯
1
0
0
1
0
0
⋯
0
0
0
0
0
1
⋯
0
0
⋮
⋮
⋮
⋮
⋱
⋮
⋮
0
0
0
0
⋯
0
1
]
odd rows
even rows
F_{64}=\begin{bmatrix} I &D_{32} \\ I &-D_{32} \end{bmatrix}\begin{bmatrix} F_{32} &0 \\ 0 & F_{32} \end{bmatrix} \begin{bmatrix} \colorbox{yellow}1& 0 &0 &0 &\cdots & 0 & 0\\ 0 & 0 & \colorbox{yellow}1 & 0 & \cdots & 0 & 0\\ \vdots & \vdots & \vdots & \vdots & \ddots & \vdots & \vdots \\ 0 & 0 & 0 & 0 & \cdots & \colorbox{yellow}1 & 0 \\ 0 & \colorbox{aqua}1 & 0 & 0 &\cdots & 0 & 0 \\ 0 & 0 & 0 & \colorbox{aqua}1 & \cdots & 0 & 0 \\ \vdots & \vdots & \vdots & \vdots & \ddots & \vdots & \vdots \\ 0 & 0 & 0 & 0 & \cdots & 0 & \colorbox{aqua}1 \end{bmatrix} \ \ \ \colorbox{yellow}{odd \ rows} \ \ \ \colorbox{aqua}{even \ rows}
F64=[IID32−D32][F3200F32]
10⋮000⋮000⋮010⋮001⋮000⋮000⋮001⋮0⋯⋯⋱⋯⋯⋯⋱⋯00⋮100⋮000⋮000⋮1
odd rows even rows
其中
D
32
D_{32}
D32为用于修正的对角矩阵,元素为熟悉的修正因子
w
w
w,我们可以发现其正是蝶形运算中的修正系数 ,即
D
32
=
[
w
0
0
0
0
⋯
0
w
1
0
0
⋯
0
0
w
2
0
⋯
⋮
⋮
⋮
⋱
⋮
0
0
0
0
w
31
]
D_{32} = \begin{bmatrix} w^0 & 0 & 0 & 0& \cdots \\ 0 & w^1 & 0 & 0 &\cdots \\ 0 & 0 & w^2 & 0& \cdots \\ \vdots & \vdots &\vdots & \ddots & \vdots \\ 0 & 0 & 0 & 0 & w^{31} \end{bmatrix}
D32=
w000⋮00w10⋮000w2⋮0000⋱0⋯⋯⋯⋮w31
最右端的矩阵为交换矩阵
P
64
P_{64}
P64,实现奇偶分序的作用 。观察这个过程,我们发现增加的乘法开销主要在
D
32
D_{32}
D32,故该级分解后运算量转换为两个
F
32
F_{32}
F32的乘法计算量和一个
D
32
D_{32}
D32的乘法运算量。依次类推,
F
32
F_{32}
F32也可以继续向下分解为
F
16
⋯
F_{16} \cdots
F16⋯ 于是最后得到的基本元素块将是
F
2
F_2
F2,展现如下
[
I
D
32
I
−
D
32
]
[
I
D
16
I
D
16
0
0
I
D
16
I
−
D
16
]
⋯
[
I
D
1
I
D
1
⋱
0
0
I
D
1
I
−
D
1
]
[
F
2
⋱
0
0
F
2
]
[
P
2
⋱
0
0
P
2
]
⋯
[
P
32
0
0
P
32
]
[
P
64
]
\begin{bmatrix} I &D_{32} \\ I &-D_{32} \end{bmatrix} \begin{bmatrix} \begin{matrix} I & D_{16} \\ I & D_{16} \end{matrix} & \text{\Large 0} \\ \text{\Large 0} & \begin{matrix} I & D_{16} \\ I & -D_{16} \end{matrix} \end{bmatrix} \cdots \begin{bmatrix} \begin{matrix} I & D_{1} & \\ I & D_{1} & \\ & & \ddots \end{matrix} &\text{\Large 0} \\ \text{\Large 0} & \begin{matrix} I & D_{1} \\ I & -D_{1} \end{matrix} \end{bmatrix} \begin{bmatrix} \begin{matrix} F_2& \\& \ddots \end{matrix} & \text{\Large 0} \\ \text{\Large 0} & \begin{matrix} F_{2} \end{matrix} \end{bmatrix} \begin{bmatrix} \begin{matrix} P_2& \\& \ddots \end{matrix} & \text{\Large 0} \\ \text{\Large 0} & \begin{matrix} P_{2} \end{matrix} \end{bmatrix} \cdots \begin{bmatrix}P_{32} & 0 \\ 0 & P_{32} \end{bmatrix} \begin{bmatrix}P_{64} \end{bmatrix}
[IID32−D32]
IID16D1600IID16−D16
⋯
IID1D1⋱00IID1−D1
F2⋱00F2
P2⋱00P2
⋯[P3200P32][P64]
由此可见,修正矩阵共有
log
2
N
\log_2N
log2N级,每级有
N
/
2
N/2
N/2次乘法运算。因而最终运算开销为
N
l
o
g
2
N
/
2
Nlog_2N/2
Nlog2N/2。来直观感受下运算量的缩减,以
N
=
1024
N=1024
N=1024为例,有
N
2
N
l
o
g
2
N
/
2
=
102
4
2
1024
∗
5
≈
205
\frac{N^2}{Nlog_2N/2}=\frac{1024^2}{1024*5} \approx 205
Nlog2N/2N2=1024∗510242≈205
由此可见,FFT为傅里叶变换处理的高性能提供了可能。
循环矩阵对角化的说明
这个说明的背景是OFDM中的循环前缀,参照维基百科,先来看定义
形式为 A = [ c 0 c n − 1 c n − 2 … c 1 c 1 c 0 c n − 1 ⋯ c 2 c 2 c 1 c 0 ⋯ c 3 ⋮ ⋮ ⋮ ⋱ ⋮ c n − 1 c n − 2 c n − 3 … c 0 ] {\displaystyle A={\begin{bmatrix}c_{0}&c_{n-1}&c_{n-2}&\dots &c_{1}\\c_{1}&c_{0}&c_{n-1}& \cdots &c_{2}\\c_{2}&c_{1}&c_{0}&\cdots &c_3 \\\vdots &\vdots& \vdots&\ddots &\vdots \\c_{n-1}&c_{n-2}&c_{n-3}&\dots &c_{0}\end{bmatrix}}} A= c0c1c2⋮cn−1cn−1c0c1⋮cn−2cn−2cn−1c0⋮cn−3…⋯⋯⋱…c1c2c3⋮c0 的矩阵就是循环矩阵。
我们关注这条性质:循环矩阵的特征向量矩阵是同样维数的离散傅立叶变换矩阵,因此循环矩阵的特征值可以很容易地通过快速傅立叶变换计算出来,或言为循环矩阵可被傅里叶矩阵对角化,即:
A
F
=
F
Λ
⇒
Λ
=
F
H
A
F
或
A
=
F
Λ
F
H
AF=F\Lambda \Rightarrow \Lambda=F^HA F或 A = F\Lambda F^{H}
AF=FΛ⇒Λ=FHAF或A=FΛFH
让我们来浅浅地证明一下,预备条件主要有3个:一是DFT的定义,二是其时域循环移位性质,三是对称性。即
条件
1
:
X
(
k
)
=
∑
n
=
0
N
−
1
x
(
n
)
w
N
n
k
,
k
=
0
,
1
,
⋯
,
N
−
1
条件
2
:
x
(
(
n
+
m
)
)
N
R
N
(
n
)
⇔
w
N
−
k
m
X
(
k
)
条件
3
:
x
(
N
−
n
)
⇔
X
(
N
−
k
)
条件1:X(k)=\sum_{n=0}^{N-1} x(n)w_{N}^{nk}, k = 0,1,\cdots,N-1 \\ 条件2:x((n+m))_N R_N(n) \Leftrightarrow w_N^{-km}X(k) \\ 条件3:x(N-n) \Leftrightarrow X(N-k)
条件1:X(k)=n=0∑N−1x(n)wNnk,k=0,1,⋯,N−1条件2:x((n+m))NRN(n)⇔wN−kmX(k)条件3:x(N−n)⇔X(N−k)
取第二行为例,可以看到
c
1
w
0
×
1
+
c
0
w
1
×
1
+
c
N
−
1
w
2
×
1
+
⋯
+
c
2
w
N
−
1
×
1
=
∑
n
=
0
N
−
1
c
(
(
N
−
n
+
1
)
)
N
R
N
(
n
)
w
n
×
1
=
w
−
1
×
1
∑
n
=
0
N
−
1
c
(
(
N
−
n
)
)
N
R
N
(
n
)
w
n
×
1
=
C
(
N
−
1
)
w
−
1
×
1
此时
k
=
1
c_1w^{0 \times 1} +c_0w^{1\times 1}+c_{N-1}w^{2 \times 1}+\cdots+c_2w^{N-1\times1}=\sum_{n=0}^{N-1}c((N-n+1))_NR_{N}(n)w^{n \times 1}=w^{-1 \times 1} \ \sum_{n=0}^{N-1}c((N-n))_NR_{N}(n)w^{n \times 1}=C(N-1)w^{-1 \times 1} \ \ 此时k=1
c1w0×1+c0w1×1+cN−1w2×1+⋯+c2wN−1×1=n=0∑N−1c((N−n+1))NRN(n)wn×1=w−1×1 n=0∑N−1c((N−n))NRN(n)wn×1=C(N−1)w−1×1 此时k=1
依此类推,我们可以知道
i
i
i就是移位的
m
m
m,
i
i
i也是DFT结果中的
k
k
k,
j
j
j相当于序列号
n
n
n 。
∑
j
=
0
N
−
1
c
(
(
N
−
j
+
i
)
)
N
R
N
(
n
)
w
j
×
i
=
C
(
(
N
−
i
)
)
N
R
N
(
n
)
w
−
i
2
i
(
k
,
m
)
,
j
(
n
)
=
0
,
1
,
2
,
⋯
,
N
−
1
\sum_{j=0}^{N-1}c((N-j+i))_N R_{N}(n) w^{j \times i}=C((N-i))_NR_{N}(n) w^{-i^2} \ \ \ \ i(k,m),j(n)=0,1,2,\cdots,N-1
j=0∑N−1c((N−j+i))NRN(n)wj×i=C((N−i))NRN(n)w−i2 i(k,m),j(n)=0,1,2,⋯,N−1
将上述形式写成矩阵,即有
[
c
(
(
N
−
j
+
i
)
)
N
R
N
(
n
)
]
[
w
i
×
j
]
=
[
C
(
(
N
−
i
)
)
N
R
N
(
n
)
]
[
w
−
i
2
]
\begin{bmatrix}c((N-j+i))_N R_{N}(n) \end{bmatrix} \begin{bmatrix}w^{i \times j} \end{bmatrix} = \begin{bmatrix}C((N-i))_NR_{N}(n) \end{bmatrix} \begin{bmatrix}w^{- i^2} \end{bmatrix}
[c((N−j+i))NRN(n)][wi×j]=[C((N−i))NRN(n)][w−i2]
两边再同除
N
\sqrt{N}
N归一化,就可写成傅里叶矩阵的形式
A
F
=
[
C
(
0
)
0
0
⋯
0
0
C
(
N
−
1
)
0
⋯
0
0
0
C
(
N
−
2
)
⋯
0
⋮
⋮
⋮
⋱
⋮
0
0
0
0
C
(
1
)
]
F
H
=
Λ
F
H
=
H
F
H
AF=\begin{bmatrix}C(0) & 0 & 0 & \cdots & 0 \\ 0 & C(N-1) &0 & \cdots & 0 \\ 0 & 0 & C(N-2) & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 &0 &C(1) \end{bmatrix} F^{H}=\Lambda F^H=HF^H
AF=
C(0)00⋮00C(N−1)0⋮000C(N−2)⋮0⋯⋯⋯⋱0000⋮C(1)
FH=ΛFH=HFH
由这个证明过程,我们还能看出第
i
i
i行输入信号序列
c
(
(
N
−
j
+
i
)
)
N
R
N
(
n
)
c((N-j+i))_NR_{N}(n)
c((N−j+i))NRN(n),对应输出的特征值为
C
(
(
N
−
i
)
)
N
R
N
(
n
)
C((N-i))_NR_{N}(n)
C((N−i))NRN(n)。这样进行的目的在于可以将求信道响应相应的卷积运算转换为FFT运算,而FFT具有高性能的运算效率,或言之,此时的特征值对应了信道响应。由此可见,数字信号处理技术的进步为通信技术的进步打下基石,而这一切都需要数学。
注意,如果循环矩阵写成下列形式
A
=
[
c
0
c
1
c
2
…
c
n
−
1
c
n
−
1
c
0
c
1
⋯
c
n
−
2
c
n
−
2
c
n
−
1
c
0
⋯
c
n
−
3
⋮
⋮
⋮
⋱
⋮
c
1
c
2
c
3
…
c
0
]
{\displaystyle A={\begin{bmatrix}c_{0}&c_{1}&c_{2}&\dots &c_{n-1}\\c_{n-1}&c_{0}&c_{1}& \cdots &c_{n-2}\\c_{n-2}&c_{n-1}&c_{0}&\cdots &c_{n-3} \\\vdots &\vdots& \vdots&\ddots &\vdots \\c_{1}&c_{2}&c_{3}&\dots &c_{0}\end{bmatrix}}}
A=
c0cn−1cn−2⋮c1c1c0cn−1⋮c2c2c1c0⋮c3…⋯⋯⋱…cn−1cn−2cn−3⋮c0
则求出的特征值即为
C
(
i
)
C(i)
C(i),这也是《Toeplitz and Circulant Matrices: A review》这本书中给出的举例矩阵。书中对循环矩阵的对角化给出了一般性的证明(第三章),所不同的是,我在此结合了DFT的性质更简便地谈了谈。
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)