『linear algebra-2』matrix
矩阵
本篇是对高等代数中"矩阵"的性质、定理以及计算方法的速记,不涉及严密的推导证明。
一、矩阵的运算性质
数乘性质:
- 数分配律:\((c + d) \cdot \text{A} = c \cdot \text{A} + d \cdot \text{A}\)
- 矩阵分配律:\(c \cdot (\text{A} + \text{B}) = c\cdot \text{A} + c \cdot \text{B}\)
- 数乘分配律:\((cd) \cdot \text{A} = c \cdot (d\cdot \text{A})\)
矩阵乘法:设 \(\text{A} = (a_{ij})_{m\times k}\),\(\text{B} = (b_{ij})_{k\times n}\),\(\text{A}\) 与 \(\text{B}\) 的乘积 \(\text{C}_{m\times n}\) 是 \(m \times n\) 阶矩阵,其元素 \(c_{ij} = \sum_{r=1}^k a_{ir}b_{rj}\)
- \(\text{A}\) 的列数 = \(\text{B}\) 的行数
- \(\text{AB}\) 的行数 = \(\text{A}\) 的行数;\(\text{AB}\) 的列数 = \(\text{B}\) 的列数
- 矩阵乘法一般不满足交换律,即 \(\text{AB} \ne \text{BA}\)
注意:设 \(\text{A}_{m\times n} \text{B}_{n\times p} \text{C}_{p\times q}\),其第 \((i, j)\) 元素表示为 \(\sum_{k = 1}^n \sum_{r=1}^{p} a_{ik} b_{kr} c_{rj}\),其中插入两个循环指标 \(k, r\)
乘法性质:设矩阵 \(\text{A}_{m\times n}\)
- 结合律:\(\text{(AB)C} = \text{A(BC)}\),即支持任意加括号
- 分配律:\(\text{(A + B)} \text{C} = \text{AC} + \text{BC}\);\(\text{A} (\text{B + C}) = \text{A} \text{B} + \text{A} \text{C}\)
- 与数值相乘:\(c \cdot (\text{AB}) = (c \cdot \text{A})\text{B} = \text{A} (c\text{B})\)
- 存在单位元:总有 \(\text{I}_m \text{A} = \text{A} = \text{A} \text{I}_n\)
注意:对于方阵,其自己可以与自己相乘;能与自己相乘的矩阵一定是方阵,记 \(\text{A}^k = \text{A} \cdots \text{A}\)(乘方定义)
乘方性质:仅当 \(\text{A}\) 是一个方阵,才能在 \(\text{A}\) 上定义乘方运算
- \(\text{A}^r \text{A}^s = \text{A}^{r+s}\),\((\text{A}^r)^s = \text{A}^{rs}\)
- 若 \(\text{AB} = \text{BA}\),则有 \((\text{AB})^r = \text{A}^r\text{B}^r\),同时有二项式定理 \((\text{A} + \text{B})^{m} = \text{A}^m + \text{C}_{m}^1\text{A}^{m-1}\text{B} + \dots + \text{C}_{m}^{m-1}\text{AB}^{m-1} + \text{B}^m\)
- 即便 \(\text{AB} = \text{AC}\) 且 \(\text{A} \ne 0\),也无法推出 \(\text{B} = \text{C}\)(不满足乘法消去律,除非 \(\text{A}\) 可逆)
- 即便 \(\text{A} \ne 0\) 且 \(\text{B} \ne 0\),也无法推出 \(\text{AB} \ne 0\)(除非 \(\text{A}\) 可逆且 \(\text{B} \ne 0\))
矩阵转置:设 \(\text{A} = (a_{ij})_{m\times n}\),其转置 \(\text{A}^T = (b_{ij})_{n \times m}\) 是 \(n \times m\) 阶矩阵,且满足 \(b_{ij} = a_{ji}\)
- 对称阵 和 反对称阵:\(\text{A}^T = \text{A}\) 说明 \(\text{A}\) 是对称阵,\(\text{A}^T = -\text{A}\) 说明 \(\text{A}\) 是反对称阵(差个负号)
- \((\text{A} + \text{B})^T = \text{A}^T + \text{B}^T\),\((c\text{A})^T = c \cdot \text{A}^T\),\((\text{A}^T)^T = \text{A}\)
- \((\text{AB})^T = \text{B}^T\text{A}^T\),即乘法拆开后顺序要反转
共轭矩阵:设 \(\text{A} = (a_{ij})_{m\times n}\) 是复矩阵,其共轭 \(\overline{\text{A}} = (\overline{a_{ij}})_{m\times n}\)
- \(\overline{\text{A} + \text{B}} = \overline{\text{A}} + \overline{\text{B}}\),\(\overline{\text{A} \cdot \text{B}} = \overline{\text{A}} \cdot \overline{\text{B}}\)(加法乘法直接拆开不换序)
- \(\overline{c \text{A}} = \overline{c} \overline{\text{A}}\),\(\overline{\text{A}}^T = \overline{\text{A}^T}\),\(\overline{\overline{\text{A}}} = \text{A}\)
二、矩阵的逆
逆方阵的定义:设 \(\text{A}\) 为 \(n\) 阶方阵,若存在 \(n\) 阶方阵 \(\text{B}\),使得 \(\text{AB} = \text{BA} = \text{I}_n\),则记 \(\text{B} = \text{A}^{-1}\) 为 \(\text{A}\) 的逆矩阵
可逆 与 不可逆:若 \(\text{A}\) 存在逆阵 \(\text{A}^{-1}\),记 \(\text{A}\) 是可逆(非奇异)的,否则是不可逆(奇异)的
"可逆"只是针对方阵讨论的,若 \(m \ne n\) 说明一定不可逆
逆阵的性质:设 \(\text{A}\) 为 \(n\) 阶方阵
若 \(\text{A}\) 可逆,则逆阵一定唯一,且 \((\text{A}^{-1})^{-1} = \text{A}\)
若 \(\text{A}\) 和 \(\text{B}\) 可逆,则 \(\text{AB}\) 也可逆,且 \((\text{AB})^{-1} = \text{B}^{-1}\text{A}^{-1}\)(乘法拆开后顺序要反转)
注意:设 \(\text{A}_1 \dots \text{A}_n\) 都可逆(\(m \ge 2\)),则 \((\text{A}_1\dots \text{A}_m)^{-1} = \text{A}^{-1}_m \dots \text{A}_1^{-1}\) 也可逆(上式推广)
若 \(\text{A}\) 可逆,且常数 \(c \ne 0\),则 \(c\cdot \text{A}\) 仍可逆,且 \((c\text{A})^{-1} = c^{-1}\text{A}^{-1}\)
若 \(\text{A}\) 可逆,则 \(\text{A}^T\) 仍可逆,且 \((\text{A}^T)^{-1} = (\text{A}^{-1})^T\),即 求逆 和 转置 运算可以交换次序
设 \(\text{A}\) 可逆,则有 \(\text{AB} = \text{AC} \Rightarrow \text{B} = \text{C}\)(两边左乘\(\text{A}^{-1}\)),\(\text{BA} = \text{CA} \Rightarrow \text{B} = \text{C}\)(两边右乘\(\text{A}^{-1}\))
注意:由上述性质可知,若 \(\text{AB} = 0\)(或 \(\text{BA} = 0\)) 且 \(\text{A}\) 可逆,则 \(\text{B} = 0\)(可逆阵可被消去)
若 \(\text{A}\) 可逆,则 \(|\text{A}^{-1}| = |\text{A}|^{-1}\)
伴随矩阵:设 \(\text{A} = (a_{ij})_{n\times n}\),\(\text{A}_{ij}\) 是 \(a_{ij}\) 在 \(|\text{A}|\) 中的代数余子式,则 \(\text{A}\) 的伴随矩阵 \(\text{A}^*\) 形式如下 \[ \begin{align} \text{A}^{*} = \begin{bmatrix} \text{A}_{11} & \text{A}_{21} & \cdots & \text{A}_{n1} \\ \text{A}_{12} & \text{A}_{22} & \cdots & \text{A}_{n2} \\ \vdots & \cdots & \cdots & \vdots \\ \text{A}_{1n} & \text{A}_{2n} & \cdots & \text{A}_{nn} \end{bmatrix} \end{align} \] 注意其行列指标是按"转置"顺序排列的:第 1 行是 原阵第 1 列的伴随矩阵
设 \(\text{A}\) 是 \(n\) 阶方阵,则有 \(\text{AA}^{*} = \text{AA}^{*} = |\text{A}|\text{ I}_n\)
设 \(\text{A}\) 是 \(n\) 阶方阵,若 \(|\text{A}| \ne 0\),则 \(\text{A}\) 可逆,由上面性质可知 \(\text{A}^{-1} = \dfrac{1}{|\text{A}|}\text{A}^{*}\)(伴随矩阵 / 行列式 求逆阵)
设 \(\text{A}\) 和 \(\text{B}\) 为 \(n\) 阶方阵,则 \(|\text{AB}| = |\text{A}||\text{B}|\)(乘积的行列式 = 行列式的乘积)
设 \(\text{A}\) 为 \(n\) 阶方阵,则 \(\text{A}\) 可逆 \(\Leftrightarrow\) \(|\text{A}| \ne 0\),可推出可逆阵的乘积一定可逆
设 \(\text{A}_1, \dots, \text{A}_m\) 是 \(n\) 阶方阵,若其中存在一个是不可逆的,则乘积 \(\text{A}_1\dots\text{A}_m\) 一定是不可逆的
伴随矩阵的性质:设 \(\text{A}\) 是 \(n\) 阶方阵
- 伴随矩阵总是存在,且满足 \(\text{AA}^{*} = \text{A}^{*}\text{A} = |\text{A}|\text{ I}_n\)
- \((\text{A}^{*})^{*} = |\text{A}|^{n-2}\text{A}\)(\(n \ge 3\));当 \(n = 2\) 时 \((\text{A}^{*})^{*} = \text{A}\)
- \((\text{AB})^{*} = \text{B}^{*}\text{A}^{*}\),即乘积拆开顺序要反转
- \((c\text{A})^{*} = c^{n-1}\text{A}^{*}\)(注意 \(n-1\) 次方)
- \(|\text{A}^{*}| = |\text{A}|^{n-1}\)(注意 \(n - 1\) 次方)
- \((\text{A}^T)^{*} = (\text{A}^{*})^T\),即转置和伴随运算可交换
- \((\text{A}^{-1})^{*} = (\text{A}^{*})^{-1}\),即求逆和伴随运算可交换
有关行列式性质的扩展:设 \(\text{A}\) 为 \(n\) 阶方阵,依矩阵运算性质有
- \(|c\text{A}| = c^n \text{A}\),即每一行都提出一个公因子 \(c\)
- \(\overline{|\text{A}|} = |\overline{\text{A}}|\),即 行列式 和 共轭 运算可交换顺序
三、矩阵初等变换
初等变换的种类:保持线性方程组解不变的矩阵变换
- 第一类初等变换:对换矩阵中的两行(两列)
- 第二类初等变换:矩阵的某行(某列)乘以非零常数
- 第三类初等变换:矩阵的某行(某列)乘以常数加到另一行(列)上
求解线性方程组的一般步骤:设 \(n\) 元线性方程组的系数矩阵为 \(\text{A}_{n\times n}\),常数列为 \(b\)
- 写出线性方程组的增广矩阵 \(\tilde{\text{A}} = (\text{A } | \ b)\)
- 对 \(\tilde{\text{A}}\) 实施初等行变换,过程可表示为 \(\tilde{\text{A}} \rightarrow (\text{I}_n \ | \ \beta)\),其中 \(\beta\) 是新的常数列
- 得到原方程组的解 \(x = \beta\)
矩阵相抵:若矩阵 \(\text{A}\) 可通过若干次初等行(列)变换变为矩阵 \(\text{B}\),则称 \(\text{A}\) 相抵于 \(\text{B}\),记作 \(\text{A} \sim \text{B}\)
相抵关系是等价关系:"等价"指同时满足"自反性"、"对称性"、"传递性"的二元关系
- 自反性:对于任意矩阵 \(\text{A}\),总有 \(\text{A} \sim \text{A}\)
- 对称性:若 \(\text{A} \sim \text{B}\),则有 \(\text{B} \sim \text{A}\)
- 传递性:若 \(\text{A} \sim \text{B}\) 且 \(\text{B} \sim \text{C}\),则有 \(\text{A} \sim \text{C}\)
相抵标准型:设 \(\text{A} = (a_{ij})_{m\times n}\),则 \(\text{A}\) 必相抵于其相抵标准型,其形式如下所示 \[ \begin{bmatrix} \text{I}_r & \textbf{O} \\ \textbf{O} & \textbf{O} \end{bmatrix} \] 其中 \(0 \le r \le \min(m, n)\);且 \(r\) 由 \(\text{A}\) 唯一确定,不随初等变换的选取而改变
阶梯型矩阵:阶梯点(非零行从左数第 1 个非零元)的列指标严格递增的矩阵,且零行必在最下方
- 设 \(\text{A} = (a_{ij})_{m \times n}\),则总可以通过初等行变换将 \(\text{A}\) 化为阶梯型矩阵
注意:由于非零元的列指标是严格递增的,故不存在高度 > 1 的台阶
初等阵:对单位方阵 \(\text{I}_n\) 实施一次三类初等行变换,得到的矩阵为三类初等阵
- 第一类初等阵:对 \(\text{I}_n\) 实施一次第一类初等行变换,即调换第 \(i\) 行和第 \(j\) 行得到 \(\text{P}_{ij}\)
- 第二类初等阵:对 \(\text{I}_n\) 实施一次第二类初等行变换,即对第 \(i\) 行乘以非零常数 \(c\) 得到 \(\text{P}_i\)
- 第三类初等阵:对 \(\text{I}_n\) 实施一次第三类初等行变换,即把第 \(i\) 行乘以常数 \(c\) 累加到第 \(j\) 行,得到 \(\text{T}_{ij}\)
注意:对 \(\text{A}\) 做一次初等行(列)变换 \(\Leftrightarrow\) 对 \(\text{A}\) 左(右)乘对应初等阵
初等阵的性质:矩阵 \(\text{A}\) 经过若干次初等变换可记作 \(\text{PAQ} = \text{P}_r \dots \text{P}_1 \text{A} \text{Q}_1\dots\text{Q}_s\)
- 初等阵都是可逆阵,且其逆阵为 \(\text{P}_{ij}^{-1} = \text{P}_{ij}\),\(\text{P}_{i}^{-1}(c) = \text{P}_i(\dfrac{1}{c})\),\(\text{T}^{-1}_{ij}(c) = \text{T}_{ij}(-c)\)
- \(|\text{P}_{ij}| = -1\),\(|\text{P}_i(c)| = c\),\(|\text{T}_{ij}(c)| = 1\)(可见第三类初等变换不改变行列式值)
- 初等变换不改变可逆性:非异阵经过初等变换仍为非异阵,奇异阵经过初等变换仍为奇异阵
有关可逆方阵的四条等价性质⭐:
矩阵 \(\text{A}\) 是非奇异阵
矩阵 \(\text{A}\) 的相抵标准型为 \(\text{I}_n\)
矩阵 \(\text{A}\) 可仅通过 初等行变换 或 初等列变换 得到 \(\text{I}_n\)(仅用行变换一般只能化到阶梯型)
也就是:设矩阵 \(\text{A}_{m\times n}\),总存在 \(m\) 阶非异阵 \(\text{P}\),\(n\) 阶非异阵 \(\text{Q}\),使 \(\text{A}\) 变成相抵标准型 \(\text{PAQ}\),即 \[ \text{A} \sim \text{I}_n = \text{PAQ} \]
矩阵 \(\text{A}\) 是若干个初等阵的乘积(可逆阵的分解)
使用初等行变换求方阵的逆:设方阵 \(\text{A} = (a_{ij})_{n \times n}\),将 \(\text{A}\) 和 \(\text{I}_n\) 左右拼接成一个 \(n \times 2n\) 阶的矩阵,形式如下 \[ (\text{A } | \text{ I}_n) \xrightarrow{初等行变换} (\text{I}_n \ | \text{ A}^{-1}) \] 对左边大矩阵进行初等行变换,将左侧 \(n \times n\) 的部分化为 \(\text{I}_n\),右侧 \(n \times n\) 的部分即为 \(\text{A}^{-1}\)
若只通过初等列变换得到逆阵,需要将 \(\text{A}\) 和 \(\text{I}_n\) 上下纵向堆叠得到 \(2n \times n\) 的大矩阵,再进行初等列变换得到 \(\text{A}^{-1}\)
注意:由可逆阵的第三条性质,可以仅通过初等变换得到 \(\text{I}_n\),即 \(\text{A}^{-1} = \text{P}_r \dots \text{P}_2\text{P}_1 = \text{Q}_1\text{Q}_2\dots\text{Q}_s\)
基于初等变换解矩阵方程:设矩阵方程为 \(\text{A}_{n \times n}\text{X}_{n \times m} = \text{B}_{n \times m}\),其中 \(\text{A}\) 可逆,可参照求逆阵的方式求解 \(\text{X}\) \[ (\text{A } | \text{ B})_{n \times (n+m)} \xrightarrow{初等行变换} (\text{I}_n \ | \text{ X}) \] 对左边大矩阵进行初等行变换,将左侧部分同样化为 \(\text{I}_n\),右侧部分即为 \(\text{X} = \text{A}^{-1}\text{B}\)
注意:对于矩阵方程 \(\text{X}_{m\times n}\text{A}_{n \times n} = \text{B}_{m\times n}\),将 \(\text{A}\) 和 \(\text{B}\) 上下堆叠得到 \((m+n) \times n\) 阶大矩阵,再做初等列变换得到 \(\text{X} = \text{BA}^{-1}\)
四、分块矩阵
分块矩阵的定义:将矩阵 \(\text{A}\) 分成 \(r\) 行,再将原矩阵分成 \(s\) 列,从而得到一个 \(r \times s\) 分块矩阵 \[ \text{A} = \begin{bmatrix} \text{A}_{11} & \text{A}_{12} & \cdots & \text{A}_{1s} \\ \text{A}_{21} & \text{A}_{22} & \cdots & \text{A}_{2s} \\ \vdots & \cdots & \cdots & \vdots \\ \text{A}_{r1} & \text{A}_{r2} & \cdots & \text{A}_{rs} \end{bmatrix} \] 其中 \(\text{A}_{ij}\) 称为 \(\text{A}\) 的第 \((i, j)\) 分块,尺寸为 \(m_i \times n_j\);\(m_i\) 是 \(\text{A}\) 的行分块方式,\(n_j\) 是 \(\text{A}\) 的列分块方式
注意:一个矩阵虽然不是对角阵,其分块形式有可能是对角阵
分块矩阵乘积:设 \(\text{A} = (\text{A}_{ij})_{r\times s}\),\(\text{B} = (\text{B}_{ij})_{s\times k}\),且 \(\text{A}\) 的列分块方式 和 \(\text{B}\) 的行分块方式相同
定义分块阵 \(\text{C} = \text{AB} = (\text{C}_{ij})_{r\times k}\)。其中 \(\text{C}_{ij} = \sum_{r=1}^k \text{A}_{ir}\text{B}_{rj}\)
分块矩阵的转置:设 \(\text{A} = (\text{A}_{ij})_{r\times s}\),则 \(\text{A}\) 的转置 \(\text{A}^T\) 是一个 \(s\times r\) 分块的矩阵,形式如下 \[ \text{A}^T = \begin{bmatrix} \text{A}^T_{11} & \text{A}^T_{21} & \cdots & \text{A}^T_{r1} \\ \text{A}^T_{12} & \text{A}^T_{22} & \cdots & \text{A}^T_{r2} \\ \vdots & \cdots & \cdots & \vdots \\ \text{A}^T_{1s} & \text{A}^T_{2s} & \cdots & \text{A}^T_{rs} \end{bmatrix} \] 即分块大矩阵先转置,每个小分块再分别转置
分块矩阵求逆:设大分块矩阵为 \(\text{M}\),形式如下 \[ \text{M} = \begin{bmatrix} \text{A}_{m\times m} & \text{B} \\ \text{C} & \text{D}_{n\times n} \end{bmatrix} \]
若 \(\text{A}\) 可逆,则 \(|\text{M}| = |\text{A}||\text{D} - \text{CA}^{-1}\text{B}|\)(顺时针旋转)
若 \(\text{D}\) 可逆,则 \(|\text{M}| = |\text{D}||\text{A} - \text{BD}^{-1}\text{C}|\)(顺时针旋转)
降阶公式:若 \(\text{A}\) 和 \(\text{D}\) 都可逆,联立上两式可得 \(|\text{A}||\text{D} - \text{CA}^{-1}\text{B}| = |\text{D}||\text{A} - \text{BD}^{-1}\text{C}|\)
也即:分解复杂大矩阵 \(\text{M} = \text{A} - \text{BD}^{-1}\text{C}\),其中 \(m > n\),这样问题就变成求解小行列式 \(\dfrac{1}{|\text{D}|} |\text{A}||\text{D} - \text{CA}^{-1}\text{B}|\)
五、Cauchy-Bint 公式
Cauchy-Bint 定理:设 \(\text{A} = (a_{ij})_{m\times n}\),\(\text{B} = (b_{ij})_{n \times m}\),则行列式 \(|\text{AB}|\) 的值按以下方式确定:
若 \(m > n\),则 \(|\text{AB}| = 0\)("高" 乘 "长" 必为 0)
若 \(m \le n\),则 \(|\text{AB}|\) 是一个 \(m\) 阶行列式,其中 \(\text{A}(\dots)\) 和 \(\text{B}(\dots)\) 分别是 \(m\) 阶子式 \[ |\text{AB}| = \sum_{1 \le j_1 \lt \dots \lt j_m \le n} \text{A}\begin{pmatrix}1 & 2 & \cdots & m \\ j_1 & j_2 & \cdots & j_m \end{pmatrix} \text{ B}\begin{pmatrix}j_1 & j_2 & \cdots & j_m \\ 1 & 2 & \cdots & m \\ \end{pmatrix} \] 即在 1 到 \(n\) 内取遍 \(m\) 个指标的组合
注意:\(m = n\) 的情形即为两个方阵相乘的特殊情况,列指标组合正好仅有一种情况