『linear algebra-2』matrix

矩阵

本篇是对高等代数中"矩阵"的性质、定理以及计算方法的速记,不涉及严密的推导证明。

一、矩阵的运算性质

  • 数乘性质:

    • 数分配律:\((c + d) \cdot \text{A} = c \cdot \text{A} + d \cdot \text{A}\)
    • 矩阵分配律:\(c \cdot (\text{A} + \text{B}) = c\cdot \text{A} + c \cdot \text{B}\)
    • 数乘分配律:\((cd) \cdot \text{A} = c \cdot (d\cdot \text{A})\)
  • 矩阵乘法:设 \(\text{A} = (a_{ij})_{m\times k}\)\(\text{B} = (b_{ij})_{k\times n}\)\(\text{A}\)\(\text{B}\) 的乘积 \(\text{C}_{m\times n}\)\(m \times n\) 阶矩阵,其元素 \(c_{ij} = \sum_{r=1}^k a_{ir}b_{rj}\)

    • \(\text{A}\) 的列数 = \(\text{B}\) 的行数
    • \(\text{AB}\) 的行数 = \(\text{A}\) 的行数;\(\text{AB}\) 的列数 = \(\text{B}\) 的列数
    • 矩阵乘法一般不满足交换律,即 \(\text{AB} \ne \text{BA}\)

    注意:设 \(\text{A}_{m\times n} \text{B}_{n\times p} \text{C}_{p\times q}\),其第 \((i, j)\) 元素表示为 \(\sum_{k = 1}^n \sum_{r=1}^{p} a_{ik} b_{kr} c_{rj}\),其中插入两个循环指标 \(k, r\)

  • 乘法性质:设矩阵 \(\text{A}_{m\times n}\)

    • 结合律:\(\text{(AB)C} = \text{A(BC)}\),即支持任意加括号
    • 分配律:\(\text{(A + B)} \text{C} = \text{AC} + \text{BC}\)\(\text{A} (\text{B + C}) = \text{A} \text{B} + \text{A} \text{C}\)
    • 与数值相乘:\(c \cdot (\text{AB}) = (c \cdot \text{A})\text{B} = \text{A} (c\text{B})\)
    • 存在单位元:总有 \(\text{I}_m \text{A} = \text{A} = \text{A} \text{I}_n\)

    注意:对于方阵,其自己可以与自己相乘;能与自己相乘的矩阵一定是方阵,记 \(\text{A}^k = \text{A} \cdots \text{A}\)(乘方定义)

  • 乘方性质:仅当 \(\text{A}\) 是一个方阵,才能在 \(\text{A}\) 上定义乘方运算

    • \(\text{A}^r \text{A}^s = \text{A}^{r+s}\)\((\text{A}^r)^s = \text{A}^{rs}\)
    • \(\text{AB} = \text{BA}\),则有 \((\text{AB})^r = \text{A}^r\text{B}^r\),同时有二项式定理 \((\text{A} + \text{B})^{m} = \text{A}^m + \text{C}_{m}^1\text{A}^{m-1}\text{B} + \dots + \text{C}_{m}^{m-1}\text{AB}^{m-1} + \text{B}^m\)
    • 即便 \(\text{AB} = \text{AC}\)\(\text{A} \ne 0\),也无法推出 \(\text{B} = \text{C}\)(不满足乘法消去律,除非 \(\text{A}\) 可逆)
    • 即便 \(\text{A} \ne 0\)\(\text{B} \ne 0\),也无法推出 \(\text{AB} \ne 0\)(除非 \(\text{A}\) 可逆且 \(\text{B} \ne 0\)
  • 矩阵转置:设 \(\text{A} = (a_{ij})_{m\times n}\),其转置 \(\text{A}^T = (b_{ij})_{n \times m}\)\(n \times m\) 阶矩阵,且满足 \(b_{ij} = a_{ji}\)

    • 对称阵 和 反对称阵:\(\text{A}^T = \text{A}\) 说明 \(\text{A}\) 是对称阵,\(\text{A}^T = -\text{A}\) 说明 \(\text{A}\) 是反对称阵(差个负号)
    • \((\text{A} + \text{B})^T = \text{A}^T + \text{B}^T\)\((c\text{A})^T = c \cdot \text{A}^T\)\((\text{A}^T)^T = \text{A}\)
    • \((\text{AB})^T = \text{B}^T\text{A}^T\),即乘法拆开后顺序要反转
  • 共轭矩阵:设 \(\text{A} = (a_{ij})_{m\times n}\) 是复矩阵,其共轭 \(\overline{\text{A}} = (\overline{a_{ij}})_{m\times n}\)

    • \(\overline{\text{A} + \text{B}} = \overline{\text{A}} + \overline{\text{B}}\)\(\overline{\text{A} \cdot \text{B}} = \overline{\text{A}} \cdot \overline{\text{B}}\)(加法乘法直接拆开不换序)
    • \(\overline{c \text{A}} = \overline{c} \overline{\text{A}}\)\(\overline{\text{A}}^T = \overline{\text{A}^T}\)\(\overline{\overline{\text{A}}} = \text{A}\)

二、矩阵的逆

  • 逆方阵的定义:设 \(\text{A}\)\(n\)方阵,若存在 \(n\) 阶方阵 \(\text{B}\),使得 \(\text{AB} = \text{BA} = \text{I}_n\),则记 \(\text{B} = \text{A}^{-1}\)\(\text{A}\) 的逆矩阵

    • 可逆 与 不可逆:若 \(\text{A}\) 存在逆阵 \(\text{A}^{-1}\),记 \(\text{A}\) 是可逆(非奇异)的,否则是不可逆(奇异)的

    • "可逆"只是针对方阵讨论的,若 \(m \ne n\) 说明一定不可逆

  • 逆阵的性质:设 \(\text{A}\)\(n\) 阶方阵

    • \(\text{A}\) 可逆,则逆阵一定唯一,且 \((\text{A}^{-1})^{-1} = \text{A}\)

    • \(\text{A}\)\(\text{B}\) 可逆,则 \(\text{AB}\) 也可逆,且 \((\text{AB})^{-1} = \text{B}^{-1}\text{A}^{-1}\)(乘法拆开后顺序要反转

      注意:设 \(\text{A}_1 \dots \text{A}_n\) 都可逆(\(m \ge 2\)),则 \((\text{A}_1\dots \text{A}_m)^{-1} = \text{A}^{-1}_m \dots \text{A}_1^{-1}\) 也可逆(上式推广)

    • \(\text{A}\) 可逆,且常数 \(c \ne 0\),则 \(c\cdot \text{A}\) 仍可逆,且 \((c\text{A})^{-1} = c^{-1}\text{A}^{-1}\)

    • \(\text{A}\) 可逆,则 \(\text{A}^T\) 仍可逆,且 \((\text{A}^T)^{-1} = (\text{A}^{-1})^T\),即 求逆转置 运算可以交换次序

    • \(\text{A}\) 可逆,则有 \(\text{AB} = \text{AC} \Rightarrow \text{B} = \text{C}\)(两边左乘\(\text{A}^{-1}\)),\(\text{BA} = \text{CA} \Rightarrow \text{B} = \text{C}\)(两边右乘\(\text{A}^{-1}\)

      注意:由上述性质可知,若 \(\text{AB} = 0\)(或 \(\text{BA} = 0\)) 且 \(\text{A}\) 可逆,则 \(\text{B} = 0\)(可逆阵可被消去)

    • \(\text{A}\) 可逆,则 \(|\text{A}^{-1}| = |\text{A}|^{-1}\)

  • 伴随矩阵:设 \(\text{A} = (a_{ij})_{n\times n}\)\(\text{A}_{ij}\)\(a_{ij}\)\(|\text{A}|\) 中的代数余子式,则 \(\text{A}\) 的伴随矩阵 \(\text{A}^*\) 形式如下 \[ \begin{align} \text{A}^{*} = \begin{bmatrix} \text{A}_{11} & \text{A}_{21} & \cdots & \text{A}_{n1} \\ \text{A}_{12} & \text{A}_{22} & \cdots & \text{A}_{n2} \\ \vdots & \cdots & \cdots & \vdots \\ \text{A}_{1n} & \text{A}_{2n} & \cdots & \text{A}_{nn} \end{bmatrix} \end{align} \] 注意其行列指标是按"转置"顺序排列的:第 1 行是 原阵第 1 列的伴随矩阵

    • \(\text{A}\)\(n\) 阶方阵,则有 \(\text{AA}^{*} = \text{AA}^{*} = |\text{A}|\text{ I}_n\)

    • \(\text{A}\)\(n\) 阶方阵,若 \(|\text{A}| \ne 0\),则 \(\text{A}\) 可逆,由上面性质可知 \(\text{A}^{-1} = \dfrac{1}{|\text{A}|}\text{A}^{*}\)伴随矩阵 / 行列式逆阵

    • \(\text{A}\)\(\text{B}\)\(n\) 阶方阵,则 \(|\text{AB}| = |\text{A}||\text{B}|\)(乘积的行列式 = 行列式的乘积)

    • \(\text{A}\)\(n\) 阶方阵,则 \(\text{A}\) 可逆 \(\Leftrightarrow\) \(|\text{A}| \ne 0\),可推出可逆阵的乘积一定可逆

      \(\text{A}_1, \dots, \text{A}_m\)\(n\) 阶方阵,若其中存在一个是不可逆的,则乘积 \(\text{A}_1\dots\text{A}_m\) 一定是不可逆的

  • 伴随矩阵的性质:设 \(\text{A}\)\(n\) 阶方阵

    • 伴随矩阵总是存在,且满足 \(\text{AA}^{*} = \text{A}^{*}\text{A} = |\text{A}|\text{ I}_n\)
    • \((\text{A}^{*})^{*} = |\text{A}|^{n-2}\text{A}\)\(n \ge 3\));当 \(n = 2\)\((\text{A}^{*})^{*} = \text{A}\)
    • \((\text{AB})^{*} = \text{B}^{*}\text{A}^{*}\),即乘积拆开顺序要反转
    • \((c\text{A})^{*} = c^{n-1}\text{A}^{*}\)(注意 \(n-1\) 次方)
    • \(|\text{A}^{*}| = |\text{A}|^{n-1}\)(注意 \(n - 1\) 次方)
    • \((\text{A}^T)^{*} = (\text{A}^{*})^T\),即转置伴随运算可交换
    • \((\text{A}^{-1})^{*} = (\text{A}^{*})^{-1}\),即求逆伴随运算可交换
  • 有关行列式性质的扩展:设 \(\text{A}\)\(n\) 阶方阵,依矩阵运算性质有

    • \(|c\text{A}| = c^n \text{A}\),即每一行都提出一个公因子 \(c\)
    • \(\overline{|\text{A}|} = |\overline{\text{A}}|\),即 行列式共轭 运算可交换顺序

三、矩阵初等变换

  • 初等变换的种类:保持线性方程组解不变的矩阵变换

    • 第一类初等变换:对换矩阵中的两行(两列)
    • 第二类初等变换:矩阵的某行(某列)乘以非零常数
    • 第三类初等变换:矩阵的某行(某列)乘以常数加到另一行(列)上
  • 求解线性方程组的一般步骤:设 \(n\) 元线性方程组的系数矩阵为 \(\text{A}_{n\times n}\),常数列为 \(b\)

    1. 写出线性方程组的增广矩阵 \(\tilde{\text{A}} = (\text{A } | \ b)\)
    2. \(\tilde{\text{A}}\) 实施初等变换,过程可表示为 \(\tilde{\text{A}} \rightarrow (\text{I}_n \ | \ \beta)\),其中 \(\beta\) 是新的常数列
    3. 得到原方程组的解 \(x = \beta\)
  • 矩阵相抵:若矩阵 \(\text{A}\) 可通过若干次初等行(列)变换变为矩阵 \(\text{B}\),则称 \(\text{A}\) 相抵于 \(\text{B}\),记作 \(\text{A} \sim \text{B}\)

  • 相抵关系是等价关系:"等价"指同时满足"自反性"、"对称性"、"传递性"的二元关系

    • 自反性:对于任意矩阵 \(\text{A}\),总有 \(\text{A} \sim \text{A}\)
    • 对称性:若 \(\text{A} \sim \text{B}\),则有 \(\text{B} \sim \text{A}\)
    • 传递性:若 \(\text{A} \sim \text{B}\)\(\text{B} \sim \text{C}\),则有 \(\text{A} \sim \text{C}\)
  • 相抵标准型:设 \(\text{A} = (a_{ij})_{m\times n}\),则 \(\text{A}\) 必相抵于其相抵标准型,其形式如下所示 \[ \begin{bmatrix} \text{I}_r & \textbf{O} \\ \textbf{O} & \textbf{O} \end{bmatrix} \] 其中 \(0 \le r \le \min(m, n)\);且 \(r\)\(\text{A}\) 唯一确定,不随初等变换的选取而改变

  • 阶梯型矩阵:阶梯点(非零行从左数第 1 个非零元)的列指标严格递增的矩阵,且零行必在最下方

    • \(\text{A} = (a_{ij})_{m \times n}\),则总可以通过初等变换\(\text{A}\) 化为阶梯型矩阵

    注意:由于非零元的列指标是严格递增的,故不存在高度 > 1 的台阶

  • 初等阵:对单位方阵 \(\text{I}_n\) 实施一次三类初等变换,得到的矩阵为三类初等阵

    • 第一类初等阵:对 \(\text{I}_n\) 实施一次第一类初等行变换,即调换第 \(i\) 行和第 \(j\) 行得到 \(\text{P}_{ij}\)
    • 第二类初等阵:对 \(\text{I}_n\) 实施一次第二类初等行变换,即对第 \(i\) 行乘以非零常数 \(c\) 得到 \(\text{P}_i\)
    • 第三类初等阵:对 \(\text{I}_n\) 实施一次第三类初等行变换,即把第 \(i\) 行乘以常数 \(c\) 累加到第 \(j\) 行,得到 \(\text{T}_{ij}\)

    注意:对 \(\text{A}\) 做一次初等行(列)变换 \(\Leftrightarrow\)\(\text{A}\) 左(右)乘对应初等阵

  • 初等阵的性质:矩阵 \(\text{A}\) 经过若干次初等变换可记作 \(\text{PAQ} = \text{P}_r \dots \text{P}_1 \text{A} \text{Q}_1\dots\text{Q}_s\)

    • 初等阵都是可逆阵,且其逆阵为 \(\text{P}_{ij}^{-1} = \text{P}_{ij}\)\(\text{P}_{i}^{-1}(c) = \text{P}_i(\dfrac{1}{c})\)\(\text{T}^{-1}_{ij}(c) = \text{T}_{ij}(-c)\)
    • \(|\text{P}_{ij}| = -1\)\(|\text{P}_i(c)| = c\)\(|\text{T}_{ij}(c)| = 1\)(可见第三类初等变换不改变行列式值)
    • 初等变换不改变可逆性:非异阵经过初等变换仍为非异阵,奇异阵经过初等变换仍为奇异阵
  • 有关可逆方阵的四条等价性质⭐:

    • 矩阵 \(\text{A}\) 是非奇异阵

    • 矩阵 \(\text{A}\) 的相抵标准型为 \(\text{I}_n\)

    • 矩阵 \(\text{A}\)通过 初等行变换初等列变换 得到 \(\text{I}_n\)(仅用行变换一般只能化到阶梯型)

      也就是:设矩阵 \(\text{A}_{m\times n}\),总存在 \(m\) 阶非异阵 \(\text{P}\)\(n\) 阶非异阵 \(\text{Q}\),使 \(\text{A}\) 变成相抵标准型 \(\text{PAQ}\),即 \[ \text{A} \sim \text{I}_n = \text{PAQ} \]

    • 矩阵 \(\text{A}\) 是若干个初等阵的乘积(可逆阵的分解)

  • 使用初等变换求方阵的逆:设方阵 \(\text{A} = (a_{ij})_{n \times n}\),将 \(\text{A}\)\(\text{I}_n\) 左右拼接成一个 \(n \times 2n\) 阶的矩阵,形式如下 \[ (\text{A } | \text{ I}_n) \xrightarrow{初等行变换} (\text{I}_n \ | \text{ A}^{-1}) \] 对左边大矩阵进行初等行变换,将左侧 \(n \times n\) 的部分化为 \(\text{I}_n\),右侧 \(n \times n\) 的部分即为 \(\text{A}^{-1}\)

    若只通过初等列变换得到逆阵,需要将 \(\text{A}\)\(\text{I}_n\) 上下纵向堆叠得到 \(2n \times n\) 的大矩阵,再进行初等变换得到 \(\text{A}^{-1}\)

    注意:由可逆阵的第三条性质,可以仅通过初等变换得到 \(\text{I}_n\),即 \(\text{A}^{-1} = \text{P}_r \dots \text{P}_2\text{P}_1 = \text{Q}_1\text{Q}_2\dots\text{Q}_s\)

  • 基于初等变换解矩阵方程:设矩阵方程为 \(\text{A}_{n \times n}\text{X}_{n \times m} = \text{B}_{n \times m}\),其中 \(\text{A}\) 可逆,可参照求逆阵的方式求解 \(\text{X}\) \[ (\text{A } | \text{ B})_{n \times (n+m)} \xrightarrow{初等行变换} (\text{I}_n \ | \text{ X}) \] 对左边大矩阵进行初等行变换,将左侧部分同样化为 \(\text{I}_n\),右侧部分即为 \(\text{X} = \text{A}^{-1}\text{B}\)

    注意:对于矩阵方程 \(\text{X}_{m\times n}\text{A}_{n \times n} = \text{B}_{m\times n}\),将 \(\text{A}\)\(\text{B}\) 上下堆叠得到 \((m+n) \times n\) 阶大矩阵,再做初等列变换得到 \(\text{X} = \text{BA}^{-1}\)


四、分块矩阵

  • 分块矩阵的定义:将矩阵 \(\text{A}\) 分成 \(r\) 行,再将原矩阵分成 \(s\) 列,从而得到一个 \(r \times s\) 分块矩阵 \[ \text{A} = \begin{bmatrix} \text{A}_{11} & \text{A}_{12} & \cdots & \text{A}_{1s} \\ \text{A}_{21} & \text{A}_{22} & \cdots & \text{A}_{2s} \\ \vdots & \cdots & \cdots & \vdots \\ \text{A}_{r1} & \text{A}_{r2} & \cdots & \text{A}_{rs} \end{bmatrix} \] 其中 \(\text{A}_{ij}\) 称为 \(\text{A}\) 的第 \((i, j)\) 分块,尺寸为 \(m_i \times n_j\)\(m_i\)\(\text{A}\) 的行分块方式,\(n_j\)\(\text{A}\) 的列分块方式

    注意:一个矩阵虽然不是对角阵,其分块形式有可能是对角阵

  • 分块矩阵乘积:设 \(\text{A} = (\text{A}_{ij})_{r\times s}\)\(\text{B} = (\text{B}_{ij})_{s\times k}\),且 \(\text{A}\)分块方式\(\text{B}\)分块方式相同

    定义分块阵 \(\text{C} = \text{AB} = (\text{C}_{ij})_{r\times k}\)。其中 \(\text{C}_{ij} = \sum_{r=1}^k \text{A}_{ir}\text{B}_{rj}\)

  • 分块矩阵的转置:设 \(\text{A} = (\text{A}_{ij})_{r\times s}\),则 \(\text{A}\) 的转置 \(\text{A}^T\) 是一个 \(s\times r\) 分块的矩阵,形式如下 \[ \text{A}^T = \begin{bmatrix} \text{A}^T_{11} & \text{A}^T_{21} & \cdots & \text{A}^T_{r1} \\ \text{A}^T_{12} & \text{A}^T_{22} & \cdots & \text{A}^T_{r2} \\ \vdots & \cdots & \cdots & \vdots \\ \text{A}^T_{1s} & \text{A}^T_{2s} & \cdots & \text{A}^T_{rs} \end{bmatrix} \] 即分块大矩阵先转置,每个小分块再分别转置

  • 分块矩阵求逆:设大分块矩阵为 \(\text{M}\),形式如下 \[ \text{M} = \begin{bmatrix} \text{A}_{m\times m} & \text{B} \\ \text{C} & \text{D}_{n\times n} \end{bmatrix} \]

    • \(\text{A}\) 可逆,则 \(|\text{M}| = |\text{A}||\text{D} - \text{CA}^{-1}\text{B}|\)(顺时针旋转)

    • \(\text{D}\) 可逆,则 \(|\text{M}| = |\text{D}||\text{A} - \text{BD}^{-1}\text{C}|\)(顺时针旋转)

    • 降阶公式:若 \(\text{A}\)\(\text{D}\) 都可逆,联立上两式可得 \(|\text{A}||\text{D} - \text{CA}^{-1}\text{B}| = |\text{D}||\text{A} - \text{BD}^{-1}\text{C}|\)

      也即:分解复杂大矩阵 \(\text{M} = \text{A} - \text{BD}^{-1}\text{C}\),其中 \(m > n\),这样问题就变成求解行列式 \(\dfrac{1}{|\text{D}|} |\text{A}||\text{D} - \text{CA}^{-1}\text{B}|\)


五、Cauchy-Bint 公式

  • Cauchy-Bint 定理:设 \(\text{A} = (a_{ij})_{m\times n}\)\(\text{B} = (b_{ij})_{n \times m}\),则行列式 \(|\text{AB}|\) 的值按以下方式确定:

    • \(m > n\),则 \(|\text{AB}| = 0\)("高" 乘 "长" 必为 0)

    • \(m \le n\),则 \(|\text{AB}|\) 是一个 \(m\) 阶行列式,其中 \(\text{A}(\dots)\)\(\text{B}(\dots)\) 分别是 \(m\)子式 \[ |\text{AB}| = \sum_{1 \le j_1 \lt \dots \lt j_m \le n} \text{A}\begin{pmatrix}1 & 2 & \cdots & m \\ j_1 & j_2 & \cdots & j_m \end{pmatrix} \text{ B}\begin{pmatrix}j_1 & j_2 & \cdots & j_m \\ 1 & 2 & \cdots & m \\ \end{pmatrix} \] 即在 1 到 \(n\) 内取遍 \(m\) 个指标的组合

      注意\(m = n\) 的情形即为两个方阵相乘的特殊情况,列指标组合正好仅有一种情况


『linear algebra-2』matrix
http://larry0454.github.io/2024/08/25/linear_algebra/matrix/
Author
WangLe
Posted on
August 25, 2024
Licensed under