1,特征值与特征向量

1.1,特征值与特征向量的概念

设 \small A\in\mathbb{C}^{n\times n},如果存在常数 \small \lambda_i 和非零的 \small n 维列向量 \small \xi_i,使得:

\small A\xi_i=\lambda_i\xi_i

则称 \small \lambda_i 为 \small A 的特征值\small \xi_i 为 \small A 的对应于\small \lambda_i 的特征向量。

  • 特征向量为非零向量。
  • 特征向量与特征值是成对出现的,一个特征值可对应多个特征向量,反之不然。

将上式移项:

\small (\lambda E-A)x=0 有非零解 \small \Leftrightarrow det(\lambda E-A)=0

这是 \small n 个未知数 \small n 个方程的齐次线性方程组,它有非零解的充分必要条件是系数行列式 \small det(\lambda E-A)=0

  • \small A\in\mathbb{C}^{n\times n},称 \small \lambda E-A 为\small A特征矩阵。
  • 称 \small det(\lambda E-A) 为矩阵\small A特征多项式。
  • 称 \small det(\lambda E-A)=0 为矩阵\small A特征方程。
  • \small A 特征值就是 \small A的特征方程的根。
  • \small |\lambda I-A|=\lambda ^{n}-(a_{11}+a_{22}+...+a_{nn})\lambda^{n-1}+...+(-1)|A|
  • \small n 阶方阵 \small A在复数范围内一定有 \small n个特征值。

1.2,特征值和特征向量求法,

(1)求 \small det(\lambda I-A)=0 的 \small n 个根 \small \lambda_1,\lambda_2,...,\lambda_n,它们即为 \small A 的全部特征值。

(2)求解齐次线性方程组 \small (\lambda_i I-A)x=0,其非零解向量即为\small A的对应特征值 \small \lambda_i 的特征向量。

【例1】设 \small A=\begin{bmatrix} 1 &-2 &2 \\ -2&-2 &4 \\ 2& 4 & -2 \end{bmatrix},求\small A的特征值与特征向量。

解】因为 \small A 的特征多项式为:

\small det(\lambda I-A)=\begin{vmatrix} \lambda-1 & 2 & -2\\ 2 &\lambda+2 &-4 \\ -2& -4 &\lambda+2 \end{vmatrix}=(\lambda-2)^2(\lambda+7)

所以\small A的特征值为:\small \lambda_1=\lambda_2=2,\lambda_3=-7

当 \small \lambda_1=\lambda_2=2 时,解方程组 \small (2I-A)x=0。由

\small 2I-A=\begin{bmatrix} 1 &2 &-2 \\ 2 &4 &-4 \\ -2&-4 & 4 \end{bmatrix}=2I-A=\begin{bmatrix} 1 &2 &-2 \\ 0 &0 &0 \\ 0&0 & 0 \end{bmatrix}

得基础解析:\small p_1=[-2,1,0]^T,p_2=[2,0,1]^T

所以对应 \small \lambda_1=\lambda_2=2 的全部特征向量为 \small k_1p_1+k_2p_2,其中 \small k_1,k_2 不同时为0

当 \small \lambda_3=-7 时,解方程组 \small (-7I-A)x=0。由:

\small -7I-A=\begin{bmatrix} -8 & 2 & -2\\ 2& -5 &-4 \\ -2&-4 &-5 \end{bmatrix}=\begin{bmatrix} 1 &0 &0.5 \\ 0& 1 &1 \\ 0&0 &0 \end{bmatrix}

得基础解析:\small p_3=[-1,-2,2]^T,故对应 \small \lambda_3=-7 的全部特征向量为 \small k_3p_3,k_3\ne 0

【例2】设 \small A=\begin{bmatrix} -1&1 &3\\ 0&-1 &1 \\ 0& 0& 2 \end{bmatrix},求\small A的特征值与特征向量。

因为\small A 的特征多项式为:

\small det(\lambda I-A)=\begin{vmatrix} \lambda+1 & -1 & -3\\ 0&\lambda+1 &-1 \\ 0&0 &\lambda-2 \end{vmatrix}=(\lambda+1)^2(\lambda-2)

 所以\small A的特征值为:\small \small \lambda_1=\lambda_2=-1,\lambda_3=2

得基础解析:\small p_1=[1,0,0]^T,故对应 \small \lambda_1=\lambda_2=-1 的全部特征向量为 \small k_1p_3,k_1\ne 0

结论:特征值的线性无关的特征向量个数不超过特征值(特征方程的根)的重数。

1.3,特征值与特征向量性质

代数重数和几何重数

将 \small |\lambda I-A| 表示成不互相同的一次因子方幂乘积的型式:

\small |\lambda I-A|=(\lambda-\lambda_1)^{r_1}(\lambda-\lambda_2)^{r_2}...(\lambda-\lambda_t)^{r_t}

则称 \small r_i 为 \small A的特征值 \small \lambda_i 的代数重数(简称重数)

\small A的特征值\small \lambda_i特征空间:\small V_{\lambda _i}=\left \{ x\in \mathbb{C}^n|Ax=\lambda_i x \right \},称 \small dimV_{\lambda_i} 为\small A的特征值\small \lambda_i几何重数,表示属于\small A的特征值 \small \lambda_i 的线性无关的特征向量的个数。

设 \small \lambda_i 是\small A\in \mathbb{C}^{n\times n} 的 \small r_i 重特征值,对应 \small \lambda_i 有 \small s_i 个线性无关的特征向量,则 \small 1\leqslant s_i\leqslant r_i\leqslant n

矩阵多项式

设 \small f(\lambda) 是 \small \lambda 的多项式\small f(\lambda)=a_s\lambda^s+a_{s-1}\lambda^{s-1}+...+a_1\lambda+a_0,对于\small A\in \mathbb{C}^{n\times n},规定:\small f(A)=a_sA^s+a_{s-1}A^{s-1}+...+a_1A+a_0I,称 \small f(A) 为矩阵\small A的多项式。

\small A\in \mathbb{C}^{n\times n}\small A的 \small n 个特征值为:\small \lambda_1,\lambda_2,...,\lambda_n 对应的特征向量为 \small x_1,x_2,...,x_n,又设 \small f(\lambda) 为一多项式,则:

\small f(A)x_i=f(\lambda_i)x_i,i=1,2,...,n

即 \small f(A) 的特征值为 \small f(\lambda_1),f(\lambda_2),...,f(\lambda_n),对应的特征向量仍为 \small x_1,x_2,...,x_n特别的,若 \small f(A)=0,则所有 \small f(\lambda_i)=0

线性无关

设 \small \lambda_1,\lambda_2,..,\lambda_s 是方阵\small A的互不相同的特征值,\small x_1,x_2,...,x_s 是分别与之对应的特征向量,则 \small x_1,x_2,...,x_s 线性无关。

设 \small \lambda_1,\lambda_2,..,\lambda_s方阵\small A的互不相同的特征值, \small x_{i1},x_{i2},...,x_{ir_i} 是对应特征值 \small \lambda_i 的线性无关的特征向量,则向量组 \small x_{11},x_{12},...,x_{1r_1},x_{21},x_{22},...,x_{2r_2},...,x_{s1},x_{s2},...,x_{sr_s} 也线性无关。

设 \small n 阶方阵 \small A=(a_{ij})_{n\times n} 的特征值为 \small \lambda_1,\lambda_2,...,\lambda_n,则:

  • \small \lambda_1+\lambda_2+...+\lambda_n=a_{11}+a_{22}+...+a_{nn}
  • \small \lambda_1\lambda_2...\lambda_n=detA
  • \small A^T的特征值仍为 \small \lambda_1,\lambda_2,...,\lambda_n,而 \small A^H的特征值为 \small \overline{\lambda_1},\overline{\lambda_2},...,\overline{\lambda_n}
  • 设 \small A \in \mathbb{C}^{n\times n},则0是\small A的特征值 \small \Leftrightarrow det A=0

设 \small A=(a_{ij})_{n\times n} \in \mathbb{C}^{n\times n },称 \small a_{11}+a_{22}+...+a_{nn} 为 \small A的迹(trace),记为 \small trA,即\small trA=a_{11}+a_{22}+...+a_{nn}

设 \small A\in \mathbb{C}^{m\times n},B\in \mathbb{C}^{n\times m},则 \small tr(AB)=tr(BA)

PS:\small AB 不一定等于 \small BA,但是它们的对角线元素之和一定相等。

2,相似对角化

2.1,相似的概念与性质

给定复数域 \small \mathbb{C} 上的\small n 维线性空间 \small V,考虑\small V上的线性变换 \small T:V\rightarrow V,给定\small V的两组基

\small (1):\alpha_1,\alpha_2,...,\alpha_n;(2):\beta_1,\beta_2,...,\beta_n

两组基之间的过渡矩阵记为 \small P,可得

\small (\beta_1,\beta_2,...,\beta_n)=(\alpha_1,\alpha_2,...,\alpha_n)P

进而

\small T(\alpha_1,\alpha_2,...,\alpha_n)=(\alpha_1,\alpha_2,...,\alpha_n)A

\small T(\beta_1,\beta_2,...,\beta_n)=(\beta_1,\beta_2,...,\beta_n)B

进一步

\small P^{-1}AP=B

设 \small A,B\in \mathbb{C}^{n\times n},若存在可逆矩阵 \small P\in \mathbb{C}^{n\times n} 使得 

\small P^{-1}AP=B

则称 \small A 与 \small B 相似,记 \small A\sim B

设 \small A,B,C\in \mathbb{C}^{n\times n},则

  • 自反性:\small A\sim A
  • 对称性:\small A\sim B\Rightarrow B\sim A
  • 传递性:\small A\sim B,B\sim C\Rightarrow A\sim C

设 \small A,B\in \mathbb{C}^{n\times n}\small A\sim B\small f(\lambda) 是一多项式,则:

  • \small det(A)=det(B),rank(A)=rank(B)
  • \small f(A)\sim f(B)
  • \small det(\lambda I-A)=det(\lambda I-B),即 \small A 与 \small B 有相同的特征多项式,从而有相同的特征值。
  • \small trA=trB

PS:上述四个结论都是矩阵相似的必要而非充分条件。

【例3】

\small A=\begin{bmatrix} 1 & 0\\ 0&1 \end{bmatrix},B=\begin{bmatrix} 1 & 1\\ 0&1 \end{bmatrix}

证明(3)

\small A\sim B \Rightarrow 存在可逆矩阵 \small P 使得 \small P^{-1}AP=B,因此

\small |\lambda I-B|=|\lambda I-P^{-1}AP|=|P^{-1}\lambda I P-P^{-1}AP|=|P^{-1}(\lambda I-A)P|=|P^{-1}||\lambda I-A||P|=|\lambda I-A|

2.2,相似对角化的判定

对角矩阵是较简单的矩阵之一,无论计算它的乘积、幂、逆矩阵、特征值都比较方便。

设 \small A \in \mathbb{C}^{n \times n},若 \small A 与一对角矩阵相似,则称 \small A 可对角化。

\small A 可对角化 \small \Leftrightarrow 当且仅当存在 \small P \in \mathbb{C}^{n \times n}_n,使得 \small P^{-1}AP=\Lambda =diag\left \{ \lambda_1,\lambda_2,...,\lambda_n \right \}

\small \Leftrightarrow \small AP=PA,令 \small P=[p_1,p_2,...,p_n]\small P 可逆。

\small \Leftrightarrow \small [Ap_1,Ap_2,...,Ap_n]=[\lambda_1p_1,\lambda_2p_2,...,\lambda_np_n]

\small \Leftrightarrow \small Ap_1=\lambda_1p_1,Ap_2=\lambda_2p_2,...,Ap_n=\lambda_np_n

\small \Leftrightarrow \small \lambda_1,\lambda_2,...,\lambda_n 是 \small A的 \small n 个特征值,\small p_1,p_2,...,p_n 是对应的特征向量,\small p_1,p_2,...,p_n 线性无关。

\small \Leftrightarrow \small A有 \small n 个线性无关的特征向量。

即:\small A \in \mathbb{C}^{n \times n},则 \small A 可对角化的充要条件是\small A有 \small n 个线性无关的特征向量。

推论1:设 \small \small \lambda_1,\lambda_2,...,\lambda_s 是 \small A \in \mathbb{C}^{n \times n} 的所有互异的特征值,其重数分别为 \small r_1,r_2,...,r_s。若 \small \small \lambda_1,\lambda_2,...,\lambda_s 的几何重数分别为 \small r_1,r_2,...,r_s\small A可对角化。( \small dimV_{\lambda_i}=r_i\Leftrightarrow 对应 \small \lambda_i 有 \small r_i 个线性无关的特征向量)

推论2:设 \small A \in \mathbb{C}^{n \times n},如果\small A\small n个不同的特征值,则\small A 可对角化。

PS1:矩阵 \small A\in \mathbb{C}^{n\times n} 可相似对角化 \small \Leftrightarrow \small A的每个相异特征值的几何重数等于代数重数 \small \Leftrightarrow \small A的相异特征值的几何重数之和等于 \small n

PS2:当 \small A \in \mathbb{C}^{n\times n} 存在某个特征值,使得其几何重数小于代数重数时,则矩阵不能对角化,比如:\small A=\begin{bmatrix} 1 &1 \\ 0& 1 \end{bmatrix}

【例4】判断下列矩阵是否可对角化,如果是,求相似变换矩阵 \small P 和相应的对角矩阵。

\small A=\begin{bmatrix} -1 & 1 &0 \\ -4 & 3 &0 \\ 1 &0 &2 \end{bmatrix}

\small \because |\lambda I -A|=(\lambda-1)^2(\lambda-2)

\small \therefore \lambda_1= \lambda_2=1, \lambda_3=2

对于单重特征值 \small \lambda_3=2,几何重数=代数重数=1。

因此只需要考虑多重特征值的情形:

\small I-A=\begin{bmatrix} 2 &-1 &0 \\ 4& -2& 0\\ -1& 0 &-1 \end{bmatrix}\rightarrow \begin{bmatrix} 1 &0 &1 \\ 0& 1&2 \\ 0 &0 &0 \end{bmatrix}

因此 \small rank(I-A)=2,故对应 \small 2 重特征值 \small 1 的特征空间的维数为 \small 1,即特征值\small 1的几何重数<代数重数,因此矩阵 \small A不可对角化。

\small A=\begin{bmatrix} 2 &1 &1 \\ 2& 3& 4\\ -1&-1 & -2 \end{bmatrix}

因为 \small det(\lambda I-A)=(\lambda -1)(\lambda +1)(\lambda -3),所以 \small A 的 \small 3 个特征值分别为 \small \lambda_1=1,\lambda_2=-1,\lambda_3=3

由于\small A \small 3 个互异的特征值,故\small A可对角化。

\small \lambda_1=1 对应的特征方程为 \small (I-A)x=0

\small I-A=\begin{bmatrix} -1 & -1 &-1 \\ -2& -2&-4 \\ 1& 1& 3 \end{bmatrix}\rightarrow \begin{bmatrix} 1 &1 &0 \\ 0& 0& 1\\ 0& 0 & 0 \end{bmatrix}

可得 \small \lambda_1 所对应的一个特征向量为 \small p_1=[-1,1,0]^T

类似可求得 \small \lambda_2=-1,\lambda_3=3 所对应的特征向量分别为:

\small p_2=[0,-1,1]^T,p_3=[-2,-3,1]^T

令 \small P=\begin{bmatrix} -1 &0 &-2 \\ 1& -1& -3\\ 0&1 &1 \end{bmatrix},则有 \small P^{-1}AP=\begin{bmatrix} 1 & 0 & 0\\ 0& -1& 0\\ 0&0 &3 \end{bmatrix}

2.3,相似对角化的应用

【例5】\small A=\begin{bmatrix} 1 & 4 &2 \\ 0&-3 & 4\\ 0&4 &3 \end{bmatrix},求 \small A^{100}

\small \because |\lambda I-A|=(\lambda-1)(\lambda ^2-25),\therefore \lambda_2=5,\lambda_3=-3

可求得对应 \small \lambda_1,\lambda_2,\lambda_3 的一个特征向量分别为:

\small p_1=[1,0,0]^T,p_2=[2,1,2]^T,p_3=[1,-2,1]^T

令 \small P=\begin{bmatrix} 1 &2 &1 \\ 0&1 &-2 \\ 0& 2& 1 \end{bmatrix}\small P^{-1}AP=\Lambda =\begin{bmatrix} 1& & \\ & 5& \\ & &-5 \end{bmatrix}

于是 \small \Lambda ^{100}=(P\Lambda P^{-1})^{100}=P\Lambda ^{100}P^{-1}=\begin{bmatrix} 1 & 0 &5^{100}-1 \\ 0& 5^{100} &0 \\ 0 &0 &5^{100} \end{bmatrix}

【例6】求解 \small u_{k+1}=Au_k,其中 \small A=\begin{bmatrix} 1 &1 \\ 1 &0 \end{bmatrix}\small u_0=\begin{bmatrix} 1\\0 \end{bmatrix}

\small \because |\lambda I -A|=\lambda^2-\lambda-1,\therefore \lambda_1=\frac{1+\sqrt{5}}{2},\lambda_2=\frac{1-\sqrt{5}}{2}

由于 \small \lambda_i I-A=\begin{bmatrix} \lambda_i-1 &-1 \\ -1& \lambda_i \end{bmatrix}\rightarrow \begin{bmatrix} 1 &-\lambda_i \\ 0& 0 \end{bmatrix}

可求得对应 \small \lambda_1,\lambda_2 的一个特征向量为:

\small p_1=[\lambda_1,1]^T,p_2=[\lambda_2,1]^T

令 \small P=\begin{bmatrix} \lambda_1 &\lambda_2 \\ 1& 1 \end{bmatrix},则有 \small P^{-1}AP=\Lambda =\begin{bmatrix} \lambda_1 & \\ & \lambda_2 \end{bmatrix}

进而 \small u_k=Au_{k-1}=A^2u_{k-2}=...=A^ku_0=(P\Lambda P^{-1})^ku_0

\small =P\Lambda ^kP^{-1}u_0=(p_1,p_2)\begin{bmatrix} \lambda_1 & \\ & \lambda_2 \end{bmatrix}\frac{1}{\sqrt{5}}\begin{bmatrix} 1\\-1 \end{bmatrix}

\small =\frac{1}{\sqrt{5}}\lambda_1^kp_1+(-\frac{1}{\sqrt{5}})\lambda_2^kp_2=\frac{1}{\sqrt{5}}\begin{bmatrix} \lambda_1^{k+1} -\lambda_2^{k+1} \\ \lambda_1^{k} -\lambda_2^{k} \end{bmatrix}

故Fibonacci数列的通项 \small F_k=\frac{1}{\sqrt{5}}\left [ \left ( \frac{1+\sqrt{5}}{1} \right ) ^2- \left ( \frac{1-\sqrt{5}}{1} \right )^2 \right ]

【例7】求解一阶常系数微分方程组 \small \left\{\begin{matrix} \frac{dx_1}{dt}=x_2\\ \frac{dx_2}{dt}=x_3\\ \frac{dx_3}{dt}=-6x_1-11x_2-6x_3 \end{matrix}\right.

分析问题的解是 \small x=\begin{bmatrix} x_1\\ x_2 \\ x_3 \end{bmatrix}=c_1e^{\lambda_1 t}p_1+c_2e^{\lambda_2 t}p_2+c_3e^{\lambda_3 t}p_3

其中 \small p_1,p_2,p_3 为对应于 \small \lambda_1,\lambda_2,\lambda_3 的特征向量,\small c_1,c_2,c_3 为任意常数。

把微分方程组改写为矩阵形式:\small \frac{dx}{dt}=Ax

其中 \small x=\begin{bmatrix} x_1\\ x_2 \\ x_3 \end{bmatrix},\frac{dx}{dt}=\begin{bmatrix} \frac{dx_1}{dt}\\ \frac{dx_2}{dt}\\ \frac{dx_3}{dt} \end{bmatrix},A=\begin{bmatrix} 0 &1 & 0\\ 0& 0& 1\\ -6& -11 &-6 \end{bmatrix}

令 \small x=Py

\small P=\begin{bmatrix} 1 &1 &1 \\ -1& -2& -3\\ 1 & 4& 9 \end{bmatrix},y=\begin{bmatrix} y_1\\ y_2 \\ y_3 \end{bmatrix}

\small \frac{dy}{dt}=P^{-1}\frac{dx}{dt}=P^{-1}Ax=P^{-1}APy=\begin{bmatrix} -1 &0 &0 \\ 0 & -2& 0\\ 0 &0 &-3 \end{bmatrix}y

\small \frac{dy_1}{dt}=-y_1,\frac{dy_2}{dt}=-2y_2,\frac{dy_3}{dt}=-3y_3

其一般解为:\small y_1=c_1e^{-t},y_2=c_2e^{-2t},y_3=c_3e^{-3t}

再由\small x=Py,求得原微分方程组的一般解为:

\small \left\{\begin{matrix} x_1=c_1e^{-t}+c_2e^{-2t}+c_3e^{-3t}\\ x_2=-c_1e^{-t}-2c_2e^{-2t}-3c_3e^{-3t}\\ x_3=c_1e^{-t}+4c_2e^{-2t}+9c_3e^{-3t} \end{matrix}\right.,(c_1,c_2,c_3\in \mathbb{C})

3,Jordan标准

3.1,Jordan标准的概念与性质

Jordan标准是为解决不能相似对角化的问题而引入的。

形如 \small J_{r_i}(\lambda_i)=\begin{bmatrix} \lambda_i &1 & & \\ & \lambda_i& ... & \\ & & ...&1 \\ & & & \lambda_i \end{bmatrix}_{r_i\times r_i} 的矩阵称为特征值 \small \lambda_i 对应的 \small r_i 阶的 \small Jordan 块。有若干个  \small Jordan 块构成的分块对角矩阵:

\small J=diag\left \{ J_{r_1}(\lambda_1), J_{r_2}(\lambda_2) ,,..., J_{r_s}(\lambda_s) \right \},称为\small Jordan矩阵。

  • \small Jordan矩阵与对角矩阵的差异:仅在于它的上对角线(与对角线平行的上面的一个对角线)元素是 \small 1 或 \small 0,它是一个特殊的上三角矩阵。
  • \small Jordan 块本身就是一个\small Jordan 矩阵。
  • 当 \small r_i>1 时, \small Jordan 块 \small J_{r_i}(\lambda_i) 不可对角化。
  • 对角矩阵是一个 \small Jordan 矩阵,它的每个 \small Jordan 块都是\small 1 阶的 \small \Leftrightarrow \small A 的初等因子都是 \small 1 次的。
  • \small Jordan 矩阵中不同 \small Jordan 块对应的特征值可能相同。

  • \small Jordan 块还有下三角的形式。

\small J_1(2)=[2],J_2(3)=\begin{bmatrix} 3 &1 \\ 0 &3 \end{bmatrix},J_3(2)=\begin{bmatrix} 2 &1 &0 \\ 0& 2 & 1\\ 0& 0 &2 \end{bmatrix}

\small J_1(2),J_2(3),J_3(2),分别是 \small 1,2,3 阶的\small Jordan 矩阵。

\small J=\begin{bmatrix} J_1(2) & & \\ & J_2(3) & \\ & & J_3(2) \end{bmatrix} 是一个6阶的 \small Jordan 矩阵。

\small Jordan 定理:设 \small A \in \mathbb{C}^{n \times n},则 \small A 与一个\small Jordan 矩阵 \small J 相似,即存在可逆矩阵 \small P\in \mathbb{C}^{n\times n},使得:

\small P^{-1}AP=J

且这个 \small Jordan 矩阵\small J\small Jordan块的排列次序外由\small A唯一确定,此时也称 \small A=PJP^{-1} 为矩阵 \small A 的 \small Jordan分解。

  • 矩阵不一定可以相似对角化,但一定可以与\small Jordan矩阵相似。
  • 因为相似矩阵有相同的特征值,所以\small Jordan标准型的对角线元素 \small \lambda_1,\lambda_2,...,\lambda_s 就是矩阵的特征值。
  • \small Jordan 标准中,不同 \small Jordan 块的对角线元素可能相同,因此特征值 \small \lambda_i 的代数重数 \small \geqslant \lambda_i 对应的某个 \small Jordan 块的阶数。

3.2,Jordan标准型求法

特征向量法:\small A \in \mathbb{C}^{n \times n} 

(1)如果 \small \lambda_i 是\small A 的单重特征值,则\small \lambda_i对应于 \small 1 阶 \small Jordan 块 \small J_1(\lambda_i)

(2)如果\small \lambda_i 是\small A 的 \small r_i(r_i\geqslant 1) 重特征值,若 \small s_i=dimV_{\lambda_i},则对应 \small \lambda_i 就有 \small s_i 个以\small \lambda_i 为对角元的\small Jordan 块,且这些\small Jordan 块的阶数之和等于 \small r_i

(3)由\small A的所有相异特征值对应的\small Jordan 块构成\small Jordan矩阵即为 \small A 的标准型。

优点:计算简单,并且由已经求得的特征向量可以求得相似变换矩阵。

缺点:当矩阵\small A的某个特征值重数较高时,对应的\small Jordan块阶数可能无法确定。

\small J=\begin{bmatrix} J_1(\lambda_1) & \\ & J_3(\lambda_1) \end{bmatrix},\hat J=\begin{bmatrix} J_2(\lambda_1) & \\ & J_2(\lambda_1) \end{bmatrix}

【例8】求下列矩阵的\small Jordan 标准型

\small A=\begin{bmatrix} -1 &0 &1 \\ 1& 2 &0 \\ -4 &0 & 3 \end{bmatrix}

已求得\small A的特征值为 \small \lambda_1=2,\lambda_2=\lambda_3=1,对应 \small 2 重特征值 \small \lambda_2=\lambda_3=1 只有一个线性无关的特征向量,故 \small A 的 \small Jordan 标准型为:

\small J=\begin{bmatrix} J_1(\lambda_1) & \\ & J_2(\lambda_2) \end{bmatrix}=\begin{bmatrix}2 &0 &0 \\ 0 & 1&1 \\ 0 &0 & 1 \end{bmatrix}

\small A=\begin{bmatrix} 3&1 &-1 \\ -2& 0 &2\\ -1 &-1& 3 \end{bmatrix}

已求得\small A的特征值为 \small \small \lambda_1=\lambda_2=\lambda_3=2,对应的线性无关特征向量为 \small p_1=[-1,1,0]^T,p_2=[1,0,1]^T

\small A 的标准型为:

\small J=\begin{bmatrix} J_1(\lambda_1) & \\ & J_2(\lambda_2) \end{bmatrix}=\begin{bmatrix} 2 &0 &0 \\ 0&2 &1 \\ 0&0 & 2 \end{bmatrix}

初等变换法:设 \small A(\lambda)=[a_{ij}(\lambda)]_{m\times n},其中 \small a_{ij}(\lambda) 都是 \small \lambda 的多项式,则称 \small A(\lambda) 为\small \lambda 矩阵或多项式矩阵。\small \lambda 矩阵 \small A(\lambda) 进行的如下三种变换称为 \small \lambda 矩阵的初等行(列)变换:

  • 交换 \small A(\lambda) 的两行(列):\small r_i\leftrightarrow r_j 或 \small c_i\leftrightarrow c_j
  • \small A(\lambda) 的某一行(列)乘以一个非零常数 \small k\small kr_i 或 \small kc_i
  • \small A(\lambda) 的某一行(列)同时乘以多项式 \small \varphi(\lambda) 加到另外一行(列):\small r_i+\varphi (\lambda)r_j 或 \small c_i+\varphi (\lambda)c_j 

注:\small \lambda 的矩阵同样可以定义秩的概念,且在初等变换下\small \lambda 矩阵的秩不变。

相抵(等价关系):设 \small A(\lambda)\small B(\lambda) 都是 \small \lambda 矩阵,且\small A(\lambda) 经过初等变换后变为\small B(\lambda),则称矩阵\small A(\lambda)\small B(\lambda) 相抵。

引理:设 \small A(\lambda) 是非零矩阵,则矩阵\small A(\lambda) 必须相抵与这样一个 \small \lambda 矩阵 \small B(\lambda)=[b_{ij}(\lambda)],其中 \small b_{11}(\lambda)\ne0,且 \small b_{11}(\lambda) 可以整除\small B(\lambda) 中的任意元素。

\small Smith 标准形:设 \small A\in \mathbb{C}^{n \times n},则 \small \lambda I-A 经过一系列初等变换可化为如下\small Smith 标准形

\small S(\lambda)=\begin{bmatrix} d_1(\lambda) & & & \\ & d_2(\lambda) & & \\ & & ... & \\ & & & d_n(\lambda) \end{bmatrix}

其中,\small d_i(\lambda) 是首 \small 1 多项式(即最高项系数为 \small 1 的多项式),\small i=1,2,...,n,且 \small d_i(\lambda)|d_{i+1}(\lambda),i=1,2,...,n-1 。 其中 \small d_1(\lambda),d_2(\lambda),...,d_n(\lambda) 为矩阵 \small A 的不变因子。

\small Smith 标准形的两个特点:

  • 设对角线元素从上到下次数逐次升高。
  • 保持整除性。

\small Smith 标准形的实现途径:初等变换+多项式除法。

【例9】求下列矩阵的 \small Smith 标准形

\small A_1(\lambda)=\begin{bmatrix} 1-\lambda & 2\lambda-1&\lambda \\ \lambda & \lambda^2& -\lambda\\ 1+\lambda^2 & \lambda^2+\lambda-1 & -\lambda^2 \end{bmatrix}

\small A_1(\lambda)\underset{c_1+c_3}{\rightarrow }\begin{bmatrix} 1 & 2\lambda-1&\lambda \\0 & \lambda^2& -\lambda\\ 1 & \lambda^2+\lambda-1 & -\lambda^2 \end{bmatrix}\underset{r_3-r_1}{\rightarrow }\begin{bmatrix} 1 & 2\lambda-1&\lambda \\0 & \lambda^2& -\lambda\\ 0 & \lambda^2-\lambda& -\lambda^2 -\lambda\end{bmatrix}

\small ...\underset{c_2\leftrightarrow c_3}{\rightarrow }\begin{bmatrix} 1 & 0&0\\0 & -\lambda&\lambda^2\\ 0 & -\lambda^2 -\lambda&\lambda^2-\lambda\end{bmatrix}\underset{c_3+\lambda c_2}{\rightarrow }\begin{bmatrix} 1 & 0&0\\0 & -\lambda&0\\ 0 & -\lambda^2 -\lambda&-\lambda^3-\lambda\end{bmatrix}\underset{...}{\rightarrow }\begin{bmatrix} 1 & 0&0\\0 & \lambda&0\\ 0 & 0&\lambda(\lambda^2+1)\end{bmatrix}

\small A_2(\lambda)=\begin{bmatrix} \lambda-\lambda_i & -1&0\\ 0& \lambda-\lambda_i& -1\\ 0& 0 & \lambda-\lambda_i\end{bmatrix} \underset{c_2+(\lambda-\lambda_i)c_3}{\rightarrow }\begin{bmatrix} \lambda-\lambda_i & -1&0\\ 0& 0& -1\\ 0& (\lambda-\lambda_i)^2 & \lambda-\lambda_i\end{bmatrix}

\small \underset{c_1+(\lambda-\lambda_i)c_3}{\rightarrow }\begin{bmatrix} 0& -1&0\\ 0& 0& -1\\ (\lambda-\lambda_i)^3& (\lambda-\lambda_i)^2 & \lambda-\lambda_i\end{bmatrix}\underset{...}{\rightarrow }\begin{bmatrix} 1& 0&0\\ 0& 1& 0\\0& 0 & (\lambda-\lambda_i)^3\end{bmatrix}

设 \small A\in \mathbb{C}^{n\times n} :

(1)对矩阵 \small \lambda I-A 实施初等变换变成 \small Smith 标准形 \small S(\lambda)=diag\left \{ d_1(\lambda),d_2(\lambda),...,d_n(\lambda) \right \},求出 \small A 的不变因子\small d_1(\lambda),d_2(\lambda),...,d_n(\lambda)

(2)将 \small A 的次数 \small >0 的不变因子 \small d_i(\lambda) 分解为一次因式方幂的乘积,这些一次因子的方幂称为 \small A 的初等因子:\small (\lambda-\lambda_1)^{r_1},(\lambda-\lambda_2)^{r_2},...,(\lambda-\lambda_s)^{r_s}

(3)写出每个初等因子 \small (\lambda-\lambda_i)^{r_i} 对应的 \small Jordan 块 \small J_{r_i}(\lambda_i)\small 1\leqslant i\leqslant s,由这些\small Jordan 块构成 \small A 的 \small Jordan 标准形:\small J=diag\left \{ J_{r_1}(\lambda_1), J_{r_2}(\lambda_2),..., J_{r_s}(\lambda_s) \right \}

【例10】求矩阵的 \small A=\begin{bmatrix} -1 & 0 &1 \\ 1& 2& 0\\ -4& 0 &3 \end{bmatrix} \small Jordan标准形

\small \lambda I-A=\begin{bmatrix} \lambda +1 &0 &-1 \\ -1 & \lambda -2&0 \\ 4 &0 & \lambda-3 \end{bmatrix}\underset{c_1+(\lambda+1)c_3}{\rightarrow }\begin{bmatrix} 0 &0 &-1 \\ -1 & \lambda -2& 0\\ (\lambda -1)^2 &0 &\lambda -3 \end{bmatrix}\underset{...}{\rightarrow }\begin{bmatrix} 1 &0 &0 \\ 0& 1& 0\\ 0 &0 &(\lambda -2)(\lambda -1)^2 \end{bmatrix}

因此 \small A 的不变因子为:\small d_1(\lambda)=1,d_2(\lambda)=1,d_3(\lambda)=(\lambda-2)(\lambda-1)^2

从而 \small A 的初等因子为:\small (\lambda-2),(\lambda-1)^2

对应的\small Jordan 块为:\small J_1(2),J_2(1)

故矩阵\small A 的\small Jordan 标准形为:\small J=\begin{bmatrix} J_1(2) & \\ & J_2(1) \end{bmatrix}=\begin{bmatrix} 2 &0 &0 \\ 0& 1& 1\\ 0& 0 &1 \end{bmatrix}

【问题】 为什么能用初等变换法求矩阵的\small Jordan 标准形?

(1)\small \lambda_i 对应的 \small r_i 阶的\small Jordan 块:\small J_{r_i}(\lambda_i)=\begin{bmatrix} \lambda_i & 1 & & \\ & \lambda_i &... & \\ & & ... & 1\\ & & & \lambda_i \end{bmatrix}_{r_i\times r_i} 

初等因子为:\small (\lambda-\lambda_i)^{r_i}

(2)设方阵 \small A 为分块对角矩阵 \small A=\begin{bmatrix} A_1 & & & \\ &A_2 & & \\ & & ... & \\ & & & A_s \end{bmatrix},则 \small A_1,A_2,...,A_s 的初等因子全体就是 \small A 的全部初等因子。

(3)两个同阶方阵 \small A 和 \small B 相似 \small \Leftrightarrow \small \lambda I-A 与 \small \lambda I-B 相抵 \small \Leftrightarrow \small A 与 \small B 有相同的初等因子或不变因子。

行列式因子法:

\small A\in \mathbb{C}^{n\times n}\small \lambda I-A 的所有 \small k 阶子式的首 \small 1 最大公因式 \small D_k(\lambda) 称为 \small A 的 \small k 阶行列式因子,\small k=1,...,n

行列式因子与不变因子:设 \small A\in \mathbb{C}^{n\times n}\small D_k(\lambda) 是 \small A 的 \small k 阶行列式因子,\small d_k(\lambda) 是 \small A 的不变因子,\small k=1,2,...,n,则

\small d_1(\lambda)=D_1(\lambda),d_k(\lambda)=\frac{D_{k+1}(\lambda)}{D_{k}(\lambda)},k=2,3,...,n

设 \small A \in \mathbb{C}^{n \times n}

  • 求出矩阵 \small \lambda I -A 的 \small n 个行列式因子:\small D_1(\lambda),D_2(\lambda),...,D_n(\lambda) 。
  • 由公式 \small d_1(\lambda)=D_1(\lambda),d_k(\lambda)=\frac{D_{k+1}(\lambda)}{D_{k}(\lambda)},k=2,3,...,n ,求出 \small A 的不变因子。
  • 求出\small A 的初等因子和 \small Jordan 标准形。

【例11】求矩阵 \small A=\begin{bmatrix} 3 &1 &-1 \\ -2& 0& 2\\ -1 &-1 &3 \end{bmatrix} 的 \small Jordan 标准形

\small \lambda I-A=\begin{bmatrix} \lambda -3 & -1 & 1\\ 2 & \lambda & -2\\ 1& 1 & \lambda -3 \end{bmatrix}

\small A 的 \small 1 阶行列式因子为 \small D_1(\lambda)=1

\small A 的 \small 2 阶子式:

\small D\begin{pmatrix} 1 &2 \\ 1 & 2 \end{pmatrix}=(\lambda-1)(\lambda-2),D\begin{pmatrix} 1 &2 \\ 1 & 3 \end{pmatrix}=-2(\lambda-2)

\small D\begin{pmatrix} 1 &2 \\ 2 & 3 \end{pmatrix}=-(\lambda-2),D\begin{pmatrix} 2&1 \\ 1 & 2 \end{pmatrix}=(\lambda-2),...

\small A 的 \small 2 阶行列式因子为 \small D_2(\lambda)=(\lambda-2)

\small A 的 \small 2 阶行列式因子为 \small \small D_3(\lambda)=(\lambda-2)^3

因此 \small A 的不变因子为:\small d_1(\lambda)=1,d_2(\lambda)=(\lambda-2),d_3(\lambda)=(\lambda-2)^2

\small A 的 \small Jordan 标准形:\small J=\begin{bmatrix} J_1(2) & \\ & J_2(2) \end{bmatrix}=\begin{bmatrix} 2 &0 &0 \\ 0& 2&1 \\ 0&0 &2 \end{bmatrix}

【例12】求矩阵 \small A=\begin{bmatrix} 2 &-1 & 1 &-1 \\ 2 & 2 & -1 & -1\\ 1 & 2 &-1 & 2\\ 0&0 &0 & 3 \end{bmatrix} 的 \small Jordan 标准形

\small \lambda I-A=\begin{bmatrix} \lambda-2 & 1 &-1 & 1\\ -2&\lambda-2 &1 &1 \\ -1& -2 & \lambda+1&-2 \\ 0& 0&0 &\lambda-3 \end{bmatrix}

\small A 的三阶子式如下:\small D\begin{pmatrix} 1,2,3\\1,2,3 \end{pmatrix}=(\lambda-1)^3,D\begin{pmatrix} 1,2,3\\1,2,4 \end{pmatrix}=-(\lambda-3)(2\lambda-5)

因为 \small D_3(\lambda) 整除每个 \small 3 阶子式,所以 \small D_3(\lambda)=1,从而 \small D_1(\lambda)=D_2(\lambda)=1

由于 \small d_4(\lambda)=|\lambda I-A|=(\lambda-3)(\lambda-1)^3,因此 \small A 的不变因子为:

\small d_1(\lambda)=d_2(\lambda)=d_3(\lambda)=1,d_4(\lambda)=(\lambda -3)(\lambda -1)^3

从而 \small A 的初等因子为:\small (\lambda-3),(\lambda-1)^3

对应的\small Jordan 块为:\small J_1(3),J_3(1)

故矩阵 \small A 的\small Jordan标准形为:\small J=\begin{bmatrix} J_1(3) & \\ & J_3(1) \end{bmatrix}=\begin{bmatrix} 3 &0 & 0 &0 \\ 0& 1& 1& 0\\ 0& 0 &1 &1 \\ 0& 0 & 0& 1 \end{bmatrix}

3.3,Jordan标准型的应用

【例13】求矩阵 \small A=\begin{bmatrix} -1 &0 &1 \\ 1& 2 &0 \\ -4& 0& 3 \end{bmatrix} 的\small Jordan 标准形及所使用的相似变换矩阵

可求得 \small A 的 \small Jordan 标准形为:

\small J=\begin{bmatrix} J_1(2) & \\ & J_2(1) \end{bmatrix}=\begin{bmatrix} 2 &0 &0 \\ 0& 1 & 1\\ 0& 0 & 1 \end{bmatrix}

设相似变换矩阵 \small P=\left [ p_1,p_2,p_3 \right ],由 \small P^{-1}AP=J,即 \small AP=PJ 得:

\small A\left [ p_1,p_2,p_3 \right ] =\left [ p_1,p_2,p_3 \right ]\begin{bmatrix} 2& & \\ &1 &1 \\ & & 1 \end{bmatrix},即

\small \left\{\begin{matrix} Ap_1=2p_1\\ Ap_2=p_2\\ Ap_3=p_2+p_3 \end{matrix}\right.\Rightarrow \left\{\begin{matrix} (2I-A)p_1=0\\ (I-A)p_2=0\\ (I-A)p_3=-p_2 \end{matrix}\right.

解线性方程组 \small (I-A)x=-p_2,即

\small \begin{bmatrix} 2 &0 &-1 \\ -1 &-1 & 0\\ 4& 0 & -2 \end{bmatrix}\begin{bmatrix} x_1\\ x_2\\ x_3 \end{bmatrix}=\begin{bmatrix} -1\\ 1\\ -2 \end{bmatrix}\Rightarrow p_3=\begin{bmatrix} 0\\ -1\\ 1 \end{bmatrix}

所以,\small P=\begin{bmatrix} 0 &1 &0 \\ 1& -1 &-1 \\ 0& 2&1 \end{bmatrix},P^{-1}AP=\begin{bmatrix} 2 & & \\ &1 &1 \\ & & 1 \end{bmatrix}

【例14】求矩阵 \small \small A=\begin{bmatrix} 3 &1 &-1 \\ -2& 0 &2 \\ -1& 1& 3 \end{bmatrix} 的\small Jordan 标准形及所使用的相似变换矩阵

求得 \small A 的 \small Jordan 标准形为:\small J=\begin{bmatrix} 2 & & \\ &2 &1 \\ & & 2 \end{bmatrix}

设相似变换矩阵 \small P=\left [ p_1,p_2,p_3 \right ],则由 \small P^{-1}AP=J,即 \small AP=PJ 得:

\small \left\{\begin{matrix} Ap_1=2p_1\\ Ap_2=2p_2\\ Ap_3=p_2+2p_3 \end{matrix}\right.\Rightarrow \left\{\begin{matrix} (2I-A)p_1=0\\ (2I-A)p_2=0\\ (2I-A)p_3=-p_2 \end{matrix}\right.

因此 \small p_1,p_2 是对应特征值 \small 2 的李你哥哥线性无关的特征向量,而对应特征值 \small 2 的广义特征向量 \small p_3 由求解非齐次线性方程组 \small (2I-A)x=-p_2 得到:

可以求得特征值\small 2 所对应的两个线性无关的特征向量为:\small \left [ -1,1,0 \right ]^T,\left [ 1,0,1 \right ]^T

可取 \small p_1=\left [ -1,1,0 \right ]^T,p_2=\left [ 1,0,1 \right ]^T,则 \small (2I-A)x=-p_2 无解。

为了是的该方程有解,需要重新选择 \small p_2,设 \small p_2=k_1\left [ -1,1,0 \right ]^T+k_2\left [ 1,0,1 \right ]^T

\small \left [ 2I-A,-p_2 \right ]=\begin{bmatrix} -1 &-1 &1 &k_1-k_2 \\ 2& 2& -2& -k_1\\ 1&1 &-1 &-k_2 \end{bmatrix}\Rightarrow \begin{bmatrix} 1 &1 &-1 &-k_2 \\ 0& 0& 0& 2k_2-k_1\\ 0&0 &0 &0 \end{bmatrix}

因此,当 \small k_1=2k_2 时 \small \left [ 2I-A \right ]x=-p_2 的解向量 \small p_3=\left [ -1,0,0 \right ]^T,故所有的相似变换矩阵为:\small P=\begin{bmatrix} -1 &-1 &-1 \\ 1& 2& 0\\ 0& 1 & 0 \end{bmatrix}

\small Jordan 标准形的幂

对于 \small r_i 阶 \small Jordan 块 \small J_i=\begin{bmatrix} \lambda_i &1 & & \\ & \lambda_i& ... & \\ & &... &1 \\ & & &\lambda_i \end{bmatrix}_{r_i\times r_i} ,有 \small J_i^k=\begin{bmatrix} \lambda_i^k &C_k^1\lambda_i^{k-1} & C_k^2\lambda_i^{k-2} &... &C_k^{r_i-1}\lambda_i^{k-r_i+1} \\ & \lambda_i^k &C_k^1\lambda_i^{k-1} & ...&C_k^{r_i-2}\lambda_i^{k-r_i+2} \\ & & ... & ...&C_k^1\lambda_i^{k-1} \\ & & & ... & \\ & & & & \lambda_i^k \end{bmatrix}=\begin{bmatrix} \lambda^k &\frac{1}{1!}(\lambda^k)' & \frac{1}{2!}(\lambda^k)'' &... &\frac{1}{(r_i-1)!}(\lambda^k)^{(r_i-1)} \\ & \lambda^k &\frac{1}{1!}(\lambda^k)' &... &\frac{1}{(r_i-2)!}(\lambda^k)^{(r_i-2)} \\ & & ...& ...& ...\\ & & &\lambda^k &\frac{1}{1!}(\lambda^k)' \\ & & & & \lambda^k \end{bmatrix}_{\lambda=\lambda_i}

其中 \small C_k^i=\frac{k!}{i!(k-i)!}

对于 \small Jordan 矩阵 \small J=\begin{bmatrix} J_1 & & & \\ & J_2 & & \\ & & ...& \\ & & & J_s \end{bmatrix},有 \small J^k=\begin{bmatrix} J_1^k & & & \\ & J_2^k & & \\ & & ...& \\ & & & J_s^k\end{bmatrix}

设 \small A\in \mathbb{C}^{n\times n},则由\small Jordan 分解定理知存在可逆矩阵 \small P\in \mathbb{C}^{n\times n} 使得

\small P^{-1}AP=J,即 \small A=PJP^{-1}

从而 \small A^k=PJ^kP^{-1}

【例15】设 \small A=\begin{bmatrix} -1 &0 &1 \\ 1& 2& 0\\ -4& 0 &3 \end{bmatrix},求 \small A^k

可求得 \small P=\begin{bmatrix} 1 &0 &0 \\ -1& -1 & 1\\ 2& 1 &0 \end{bmatrix}\small P^{-1}AP=J=\begin{bmatrix} 1 &1 & \\ & 1& \\ & & 2 \end{bmatrix}

故 \small A^k=PJ^kP^{-1}=\begin{bmatrix} 1 & 0 & 0\\ -1& -1 & 1\\ 2& 1& 0 \end{bmatrix}\begin{bmatrix} 1 &k & \\ &1 & \\ & & 2^k \end{bmatrix}\begin{bmatrix} 1 &0 &0 \\ -1& -1& 1\\ 2& 1 & 0 \end{bmatrix}

【例16】求解以及诶线性常系数微分方程组 \small \left\{\begin{matrix} \frac{dx_1}{dt}=3x_1+x_2-x_3\\ \frac{dx_2}{dt}=-2x_1+2x_3\\ \frac{dx_3}{dt}=-x_1-x_2+3x_3 \end{matrix}\right.

把微分方程改写为矩阵形式 \small \frac{dx}{dt}=Ax

其中 \small x\begin{bmatrix} x_1\\ x_2\\ x_3 \end{bmatrix}\small \frac{dx}{dt}=\begin{bmatrix} \frac{dx_1}{dt}\\ \frac{dx_2}{dt}\\ \frac{dx_3}{dt} \end{bmatrix}\small A=\begin{bmatrix} 3 &1 &-1 \\ -2& 0& 2\\ -1& -1 &3 \end{bmatrix}

令 \small x=Py,这里

\small P=\begin{bmatrix} -1 &-1 &-1 \\ 1& 2& 0\\ 0& 1 &0 \end{bmatrix},y=\begin{bmatrix} y_1\\ y_2\\ y_3 \end{bmatrix}

\small \frac{dy}{dt}=P^{-1}\frac{dx}{dt}=P^{-1}Ax=P^{-1}APy=\begin{bmatrix} 2 &0 &0 \\ 0& 2 & 1\\ 0&0 &2 \end{bmatrix}y

从而 \small \frac{dy_1}{dt}=2y_1,\frac{dy_2}{dt}=2y_2+y_3,\frac{dy_3}{dt}=2y_3

进一步可求得 \small y_1=c_1e^{2t},y_3=c_3e^{2t}

代入第 \small 2 个方程得 \small \frac{dy_2}{dt}=2y_2+c_3e^{2t}

进一步求解 \small y_2=e^{2t}(\int c_3e^{2t}e^{-2t}dt+c_3)=e^{2t}(c_2+c_3t)

由 \small x=Py 求得原微分方程组的一般解为 

\small \left\{\begin{matrix} x_1=-e^{-2t}(c_1+c_2+c_3+c_3t)\\ x_2=e^{2t}(c_1+2c_2+2c_3t)\\ x_3=e^{2t}(c_2+c_3t) \end{matrix}\right.(c_1,c_2,c_3 \in \mathbb{C})

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐