一、特征向量和特征值
1. 定义
【定义5.1】 设 \(A\) 是 \(n\) 阶矩阵。如果 \(n\) 维向量 \(\eta\) 不是零向量,并且 \(A\eta\) 与 \(\eta\) 线性相关,就称 \(\eta\) 为 \(A\) 的特征向量。
此时,存在唯一数 \(\lambda\),使得
\[A \eta = \lambda \eta ,\]称 \(\lambda\) 为 \(\pmb{\eta}\) 的特征值。(也常常说 \(\pmb{\eta}\) 是属于特征值 \(\lambda\) 的特征向量。)
2. 计算特征值和特征向量的一般公式
\(\pmb{\eta}\) 是 \(A\) 的特征向量,特征值为 \(\lambda \Leftrightarrow \eta\) 是齐次方程组 \((A - \lambda E)X = 0\) 的非零解。从而有定理:
【定理5.1】
① \(\lambda\) 是 \(A\) 的特征值 \(\Leftrightarrow |A - \lambda E| = 0;\)
② \(\eta\) 是属于特征值 \(\lambda\) 的特征向量 \(\Leftrightarrow \eta\) 是齐次方程组 \((A - \lambda E)X = 0\) 的非零解。
称 \(|\lambda E - A|\) 为 \(A\) 的特征多项式,则 \(A\) 的特征值就是它的特征多项式的根。
计算特征值和特征向量的具体步骤为:
- 计算 \(A\) 的特征多项式。
- 求出它的根,即 \(A\) 的特征值。
- 然后对每个特征值 \(\lambda\),求齐次方程组 \((A - \lambda E)X = 0\) 的非零解,即属于 \(\lambda\) 的特征向量。
【注】 \(n\) 阶矩阵的特征多项式是一个 \(n\) 次多项式,一般来说求它的根是困难的,因此上述计算步骤只能用在少数特殊矩阵上。例如用于对角矩阵和三角矩阵,得出它们的特征值就是对角线上的元素。
\(n\) 次多项式有 \(n\) 个根,因此 \(n\) 阶矩阵 \(\mathbf{A}\) 的特征值共有 \(n\) 个(其中有的相同,有的是虚数)。
\(n\) 次多项式有 \(n\) 个根,即 \(A\) 的全体不同特征值的重数和等于 \(n\)。
从定理5.1的①还可推出:
推论
① \(A - \lambda E\) 可逆 \(\Leftrightarrow \lambda\) 不是 \(A\) 的特征值。
② 特别的,\(A\) 可逆 \(\Leftrightarrow 0\) 不是 \(A\) 的特征值。
3. 特征向量与特征值的性质
【定理5.2】 如果 \(\eta\) 是 \(A\) 的特征向量,特征值为 \(\lambda\),则
① \(\eta\) 也是 \(A\) 的任何多项式 \(f(A)\) 的特征向量,特征值为 \(f(\lambda)\)。
② 如果 \(A\) 可逆,则 \(\lambda \neq 0\),并且 \(\pmb{\eta}\) 也是 \(A^{-1}\) 和 \(A^{*}\) 的特征向量,特征值分别为 \(1 / \lambda\) 和 \(|A| / \lambda\)。
(\(A\) 可逆时,\(A,A^{-1}\) 和 \(A^{*}\) 的特征向量完全一样。)
推论 如果 \(A\) 的一个多项式 \(f(A) = 0\),则 \(A\) 的每个特征值 \(\lambda\) 都满足 \(f(\lambda) = 0\)。
(于是,如果 \(f(\lambda)\neq 0\),则 \(\lambda\) 不是 \(A\) 的特征值,即 \(A - \lambda E\) 可逆。)
【注】 请注意 \(f(\lambda) = 0\) 时不能推出 \(\lambda\) 是 \(A\) 的特征值。
【定理5.3】 设 \(A\) 是 \(n\) 阶矩阵,记 \(A\) 的全体特征值为 \(\lambda_1, \lambda_2, \dots, \lambda_n\) 则
① \(\lambda_{1}\lambda_{2}\dots \lambda_{n} = |A|\)
② \(\lambda_{1} + \lambda_{2} + \dots + \lambda_{n} = \operatorname{tr}(A)\)
这里 \(\operatorname{tr}(A) = a_{11} + a_{22} + \dots + a_{nn}\),称为 \(A\) 的迹数。
【定理5.4】 设 \(\lambda\) 是 \(n\) 阶矩阵 \(\mathbf{A}\) 的特征值,则它的重数 \(\geqslant n - r(A - \lambda E)\)。
【例5.1】 如果 \(n\) 阶矩阵 \(A\) 的秩 \(\mathrm{r}(A) \leqslant 1, (n > 1)\),则 \(A\) 的特征值为 \(0, 0, \dots, 0, \operatorname{tr}(A)\)。
【证明】 因为 \(\mathrm{r}(A) < n\),所以 \(0\) 是 \(A\) 的特征值,并且根据定理5.4,特征值 \(0\) 的重数 \(\geqslant n - \mathrm{r}(A)\geqslant n - 1\) 即 \(A\) 的特征值中至少有 \(n - 1\) 个是 \(0\)。又根据定理5.3的②,另外一个特征值为 \(\operatorname {tr}(A)\)。
评注 这个例的结论很有实用价值,它给出了除对角、三角矩阵外又一类直接可写出特征值的矩阵,应该记住并且用好。
【例5.2】 设 \(\alpha, \beta\) 都是 \(n\) 维列向量时,证明
① \(\alpha \beta^{\mathrm{T}}\) 的特征值为 \(0, 0, \dots, 0, \beta^{\mathrm{T}}\alpha\)。
② 如果 \(\alpha\) 不是零向量,则 \(\alpha\) 是 \(\alpha \beta^{\mathrm{T}}\) 的特征向量,特征值为 \(\beta^{\mathrm{T}}\alpha\)。
【证明】
① 方法一 用上例的结论 \(\mathrm{r}(\alpha \pmb{\beta}^{\mathrm{T}}) \leqslant 1\),因此 \(\alpha \pmb{\beta}^{\mathrm{T}}\) 的特征值为 \(0,0,\dots,0, \operatorname{tr}(\alpha \pmb{\beta}^{\mathrm{T}})\)。
设 \(\pmb{\alpha} = (a_{1}, a_{2}, \dots, a_{n})^{\mathrm{T}}, \pmb{\beta} = (b_{1}, b_{2}, \dots, b_{n})^{\mathrm{T}}\),则 \(\pmb{\alpha} \pmb{\beta}^{\mathrm{T}}\) 的对角线元素为 \(a_{1} b_{1}, a_{2} b_{2}, \dots, a_{n} b_{n}\),于是 \(\operatorname{tr}(\pmb{\alpha} \pmb{\beta}^{\mathrm{T}}) = a_{1} b_{1} + a_{2} b_{2} + \dots + a_{n} b_{n} = \pmb{\beta}^{\mathrm{T}} \pmb{\alpha}\)。
方法二 记 \(A = \alpha \beta^{\mathrm{T}}\),则 \(A^2 = \alpha \beta^{\mathrm{T}}\alpha \beta^{\mathrm{T}} = (\beta^{\mathrm{T}}\alpha)A\),于是根据定理5.2的推论,\(A\) 的特征值都满足等式 \(\lambda^2 = (\pmb {\beta}^\mathrm{T}\pmb {\alpha})\lambda\),即只可能是 \(0\) 和 \(\pmb{\beta}^{\mathrm{T}}\pmb{\alpha}\)。
如果 \(\pmb{\beta}^{\mathrm{T}}\pmb {\alpha} = 0\),则 \(A\) 的特征值都是 \(0\)。
如果 \(\pmb{\beta}^{\mathrm{T}}\pmb{\alpha}\neq 0\),则根据定理5.3的②,\(A\) 的所有特征值之和为 \(\operatorname {tr}(A) = \pmb{\beta}^{\mathrm{T}}\pmb{\alpha}\),它们一定是 \(n - 1\) 个为 \(0\),一个为 \(\pmb{\beta}^{\mathrm{T}}\pmb{\alpha}\)。
② 仍记 \(A = \alpha \beta^{\mathrm{T}}\),则 \(A\alpha = \alpha \beta^{\mathrm{T}}\alpha = (\beta^{\mathrm{T}}\alpha)\alpha\),因此 \(\pmb{\alpha}\) 是 \(A\) 的特征向量,特征值为 \(\beta^{\mathrm{T}}\alpha\)。
【定理5.5】 如果 \(A\) 的全体特征值为 \(\lambda_1, \lambda_2, \dots, \lambda_n\),则
① \(f(A)\) 的特征值是 \(f(\lambda_1), f(\lambda_2), \dots, f(\lambda_n)\)。
(特别的 \(A + cE\) 的特征值是 \(\lambda_1 + c, \lambda_2 + c, \dots, \lambda_n + c\))
② 如果 \(A\) 可逆,则 \(A^{-1}\) 的特征值是 \(1 / \lambda_1, 1 / \lambda_2, \dots, 1 / \lambda_n\)。
\(A^{*}\) 的特征值是 \(|\mathbf{A}| / \lambda_1, |\mathbf{A}| / \lambda_2, \dots, |\mathbf{A}| / \lambda_n\)。
③ \(A^{\mathrm{T}}\) 的特征值也是 \(\lambda_1, \lambda_2, \dots, \lambda_n\)。
【定理5.6】 \(A\) 的一组特征向量 \(\pmb{\eta}_1,\pmb{\eta}_2,\dots ,\pmb{\eta}_s\) 线性无关 \(\Leftrightarrow \pmb{\eta}_1,\pmb{\eta}_2,\dots ,\pmb{\eta}_s\) 的每个属于同一特征值的部分组都线性无关。
推论 如果 \(A\) 的一组特征向量 \(\pmb{\eta}_1, \pmb{\eta}_2, \dots, \pmb{\eta}_s\) 的特征值两两不同,则 \(\pmb{\eta}_1, \pmb{\eta}_2, \dots, \pmb{\eta}_s\) 线性无关。
例如一个矩阵的特征值不同的两个特征向量一定线性无关。
二、\(n\) 阶矩阵的相似关系
【定义5.2】 设 \(A, B\) 是两个 \(n\) 阶矩阵,如果存在 \(n\) 阶可逆矩阵 \(P\),使得 \(P^{-1}AP = B\),则称 \(A\) 与 \(B\) 相似,记作 \(A \sim B\)。
矩阵的相似关系有对称性和传递性,即 \(A\sim B\Leftrightarrow B\sim A\);如果 \(A\sim B,B\sim C,\) 则 \(A\sim C\)。
当 \(P\) 和 \(A\) 乘积不可交换时,\(P^{-1}AP\) 不等于 \(A\)。但是如果 \(A\) 是数量矩阵,则任何 \(P\) 和 \(A\) 乘积可交换,从而 \(P^{-1}AP = A\),即数量矩阵只和自己相似。
【定理5.7】 当 \(A \sim B\) 时,并且 \(P^{-1}AP = B\),则
① \(f(\mathbf{A}) \sim f(\mathbf{B})\),并且 \(\mathbf{P}^{-1}f(\mathbf{A})\mathbf{P} = f(\mathbf{B})\)。
② \(A\) 可逆时 \(A^{-1} \sim B^{-1}, A^{*} \sim B^{*}\)。并且 \(P^{-1} A^{-1} P = B^{-1}, P^{-1} A^{*} P = B^{*}\)。
【定理5.8】 如果 \(A \sim B\) 时,并且 \(P^{-1}AP = B\),则
① \(|\mathbf{A}| = |\mathbf{B}|\)。
② \(\mathbf{r}(\mathbf{A}) = \mathbf{r}(\mathbf{B})\)。
③ \(A, B\) 有相同的特征多项式,从而特征值完全相同。于是 \(\operatorname{tr}(A) = \operatorname{tr}(B)\)。
④ \(\pmb{\eta}\) 是 \(A\) 的特征向量 \(\Leftrightarrow P^{-1}\pmb{\eta}\) 是 \(B\) 的特征向量。
【例5.3】 如果两个 \(n\) 阶矩阵 \(\mathbf{A},\mathbf{B}\) 中有一个可逆,则 \(AB\) 和 \(BA\) 相似。
【证明】 不妨设 \(A\) 可逆,则 \(A^{-1}(AB)A = BA\),因此 \(AB\) 和 \(BA\) 相似。
评注 一般地,没有”有一个可逆”的条件,也有 \(AB\) 和 \(BA\) 的特征值一样的结论,但是它们不一定相似。
练习题
例题1
设矩阵 ( A = \begin{pmatrix} 3 & 1 \ 2 & 2 \end{pmatrix} $,求其特征值和对应的特征向量。
解答
-
计算特征多项式:
\[|A - \lambda E| = \begin{vmatrix} 3 - \lambda & 1 \\ 2 & 2 - \lambda \end{vmatrix} = (3 - \lambda)(2 - \lambda) - 2 = \lambda^2 - 5\lambda + 4 = (\lambda - 1)(\lambda - 4)\]特征值为 (\lambda_1 = 1\(,\(\lambda_2 = 4\)。
-
对 (\lambda_1 = 1\(,解 \((A - E)X = 0\):
\[A - E = \begin{pmatrix} 2 & 1 \\ 2 & 1 \end{pmatrix} \xrightarrow{\text{行变换}} \begin{pmatrix} 2 & 1 \\ 0 & 0 \end{pmatrix}\]基础解系为 (\eta_1 = \begin{pmatrix} 1 \ -2 \end{pmatrix}\(,对应特征向量为 \(k_1 \eta_1\)((k_1 \neq 0$)。
-
对 (\lambda_2 = 4\(,解 \((A - 4E)X = 0\):
\[A - 4E = \begin{pmatrix} -1 & 1 \\ 2 & -2 \end{pmatrix} \xrightarrow{\text{行变换}} \begin{pmatrix} -1 & 1 \\ 0 & 0 \end{pmatrix}\]基础解系为 (\eta_2 = \begin{pmatrix} 1 \ 1 \end{pmatrix}\(,对应特征向量为 \(k_2 \eta_2\)((k_2 \neq 0$)。
例题2
设 ( A \(为 3 阶矩阵,已知 \( \operatorname{tr}(A) = 6\),( |A| = 8 \(,且 \( A \) 有一个特征值 2。求 ( A $ 的其余特征值。
解答
设特征值为 (\lambda_1, \lambda_2, \lambda_3$,由已知:
不妨设 (\lambda_1 = 2$,代入得:
\[2 + \lambda_2 + \lambda_3 = 6 \implies \lambda_2 + \lambda_3 = 4, \quad 2\lambda_2 \lambda_3 = 8 \implies \lambda_2 \lambda_3 = 4\]解方程 (t^2 - 4t + 4 = 0\(,得 \(t = 2\)。
因此其余特征值均为 2,即特征值为 (2, 2, 2$。
例题3
设 ( \alpha = \begin{pmatrix} 1 \ 2 \end{pmatrix} \(,\( \beta = \begin{pmatrix} 3 \\ 4 \end{pmatrix} \),求矩阵 ( A = \alpha \beta^{\mathrm{T}} $ 的特征值和特征向量。
解答
-
计算 ( A = \begin{pmatrix} 1 \ 2 \end{pmatrix} \begin{pmatrix} 3 & 4 \end{pmatrix} = \begin{pmatrix} 3 & 4 \ 6 & 8 \end{pmatrix} \(。 \( \operatorname{r}(A) = 1 \),由例 5.1,特征值为 (0, \operatorname{tr}(A) = 3 + 8 = 11$。
-
对 (\lambda = 0\(,解 \(AX = 0\):
\[\begin{pmatrix} 3 & 4 \\ 6 & 8 \end{pmatrix} \xrightarrow{\text{行变换}} \begin{pmatrix} 3 & 4 \\ 0 & 0 \end{pmatrix}\]基础解系为 (\eta_1 = \begin{pmatrix} 4 \ -3 \end{pmatrix}\(,对应特征向量为 \(k_1 \eta_1\)((k_1 \neq 0$)。
-
对 (\lambda = 11\(,解 \((A - 11E)X = 0\):
\[A - 11E = \begin{pmatrix} -8 & 4 \\ 6 & -3 \end{pmatrix} \xrightarrow{\text{行变换}} \begin{pmatrix} -8 & 4 \\ 0 & 0 \end{pmatrix}\]基础解系为 (\eta_2 = \begin{pmatrix} 1 \ 2 \end{pmatrix}\(,即 \(\alpha\) 自身,对应特征向量为 (k_2 \eta_2\((\(k_2 \neq 0\))。
例题4
设 ( A \(为 2 阶矩阵,特征值为 1 和 3,对应的特征向量分别为 \( \eta_1 = \begin{pmatrix} 1 \\ 1 \end{pmatrix}\),( \eta_2 = \begin{pmatrix} 1 \ -1 \end{pmatrix} \(。求 \( A^{2023} \)。
解答
-
令 ( P = \begin{pmatrix} 1 & 1 \ 1 & -1 \end{pmatrix} \(,则 \( P^{-1}AP = \Lambda = \begin{pmatrix} 1 & 0 \\ 0 & 3 \end{pmatrix} \),即 ( A = P \Lambda P^{-1} \(。 计算 \( P^{-1} = \frac{1}{-2} \begin{pmatrix} -1 & -1 \\ -1 & 1 \end{pmatrix} = \begin{pmatrix} \frac{1}{2} & \frac{1}{2} \\ \frac{1}{2} & -\frac{1}{2} \end{pmatrix} \)。
-
由 ( A^{2023} = P \Lambda^{2023} P^{-1} \(,且 \( \Lambda^{2023} = \begin{pmatrix} 1 & 0 \\ 0 & 3^{2023} \end{pmatrix} \),得:
\[A^{2023} = \begin{pmatrix} 1 & 1 \\ 1 & -1 \end{pmatrix} \begin{pmatrix} 1 & 0 \\ 0 & 3^{2023} \end{pmatrix} \begin{pmatrix} \frac{1}{2} & \frac{1}{2} \\ \frac{1}{2} & -\frac{1}{2} \end{pmatrix}\] \[= \begin{pmatrix} 1 & 3^{2023} \\ 1 & -3^{2023} \end{pmatrix} \begin{pmatrix} \frac{1}{2} & \frac{1}{2} \\ \frac{1}{2} & -\frac{1}{2} \end{pmatrix} = \begin{pmatrix} \frac{1 + 3^{2023}}{2} & \frac{1 - 3^{2023}}{2} \\ \frac{1 - 3^{2023}}{2} & \frac{1 + 3^{2023}}{2} \end{pmatrix}\]
例题5
设 ( A \(为 3 阶可逆矩阵,特征值为 \( \lambda_1, \lambda_2, \lambda_3\)。求 ( A^{-1} + 2E $ 的特征值。
解答
由定理 5.5:
- ( A^{-1} \(的特征值为 \( \frac{1}{\lambda_1}, \frac{1}{\lambda_2}, \frac{1}{\lambda_3}\)
- ( A^{-1} + 2E \(的特征值为 \( \frac{1}{\lambda_1} + 2, \frac{1}{\lambda_2} + 2, \frac{1}{\lambda_3} + 2\)