矩阵代数的 Burnside 定理

数学
Author

sun123zxy

Published

January 21, 2024

Modified

March 19, 2024

Abstract
我们详细重述并证明 Simultaneous Triangularization (H. Radjavi and P. Rosenthal) 中的 Burnside 定理及其相关推论.

我们详细重述并证明 [1, Sec. 1.2] 中的 Burnside 定理及其相关推论.

下面设 \(V\) 是复数域 \(\mathbb C\) 上的有限维线性空间,\(\mathcal B(V)\)\(V\) 上的线性变换代数;\(I\)\(\mathcal B(V)\) 的单位元.称线性变换族 \(\mathcal C \subset B(V)\) 可约,当且仅当其存在非平凡不变子空间——即存在非零且不是全空间的子空间 \(M \subset V\),使得对任意线性变换 \(A \in \mathcal C\),都有 \(AM := \{ Ax : x \in M \} \subset M\)

Burnside 定理证明较长.为使逻辑顺畅,先做一些准备工作.

Lemma 1\(\mathcal A\)\(\mathcal B(V)\) 上的乘法半群,若 \(\mathcal A\) 不可约,则对任意非零的 \(x \in V\),都有 \(\mathcal A x := \{ Ax : A \in \mathcal A \} = V\)(此时称 \(x\)\(\mathcal A\) 的循环向量).

Proof. 首先 \(\mathcal A \neq \{ 0 \}\),因为任何 \(V\) 的子空间都是后者的不变子空间.

  • 注意到 \(\operatorname{Ker}\mathcal A := \bigcap_{A \in \mathcal A} \operatorname{Ker}A\)\(\mathcal A\) 的一个不变子空间,而 \(\mathcal A\) 不可约,故 \(\operatorname{Ker}\mathcal A = \{ 0 \}\)\(V\).因为 \(\mathcal A \neq \{0\}\),后者不可能发生,故 \(\operatorname{Ker}\mathcal A = \{ 0 \}\)
  • 注意到 \(\mathcal A x := \{ A x : A \in \mathcal A \}\)\(\mathcal A\) 的一个不变子空间,而 \(\mathcal A\) 不可约,故 \(\mathcal A x = \{ 0 \}\)\(V\).由 \(x \neq 0\)\(\operatorname{Ker}\mathcal A = \{ 0 \}\),前者不可能发生,故 \(\mathcal A x = V\)

Remark. 事实上 \(\mathcal B(V)\) 上半群的可约性等价于其线性生成的代数的可约性,见 [1], Definition 2.1.1

Corollary 1\(V^*\)\(V\) 的对偶空间.设 \(\mathcal A\)\(\mathcal B(V)\) 上的乘法半群,\(\mathcal A^* := \{A^* : A \in \mathcal A \}\)\(\mathcal A\) 的对偶线性变换构成的集合(显然它也是个半群).若 \(\mathcal A\) 不可约,则对任意非零的线性函数 \(\varphi \in V^*\),都有 \(\mathcal A^* \varphi := \{ A^* \varphi : A^* \in \mathcal A^* \} = \{ \varphi A : A \in \mathcal A \} = V^*\)

Proof. 定义 \(\mathcal A^* \varphi\) 的 annihilator \((\mathcal A^* \varphi)^0 := \{ x^{**} \in V^{**} : (\mathcal A^* \varphi)(x) = 0 \}\).由 \(\dim (A^* \varphi)^0 = \dim V^* - \dim (A^* \varphi)\) [2, Sec. 3F]\[ \begin{aligned} \mathcal A^* \varphi = V^* &\iff \dim (\mathcal A^* \varphi) = \dim V^* \\ &\iff \dim (\mathcal A^* \varphi)^0 = 0 \\ &\iff (\mathcal A^* \varphi)^0 = \{0\} \end{aligned} \] 由 annihilator 的定义和 Lemma 1\[ \begin{aligned} (\mathcal A^* \varphi)^0 = \{0\} &\iff (\mathcal A^* \varphi) x \neq \{0\},\quad \forall x \neq 0 \\ &\iff \varphi \mathcal A x \neq \{0\},\quad \forall x \neq 0 \\ &\iff \varphi V \neq \{0\} \\ &\iff \varphi \neq 0 \end{aligned} \] 故最终我们得到 \(\mathcal A^* \varphi = V^* \iff \varphi \neq 0\)

若下面的猜想成立,则上述推论将具有更简单的推导.

Conjecture 1\(\mathcal A\) 不可约,则 \(\mathcal A^*\) 也不可约.

我们暂未找到证明或证伪上述猜想的方法.

下面来证明 Burnside 定理.

Theorem 1 (Burnside 定理) \(\mathcal B(V)\) 的不可约子代数有且只有 \(\mathcal B(V)\)

首先说明 \(\mathcal B(V)\) 的不可约性.因为 \(\mathcal B(V) M = V\) 对任意非零不变子空间 \(M\) 成立,故 \(\mathcal B(V)\) 不可约.下面设 \(\mathcal A\) 是一任意给定的 \(\mathcal B(V)\) 的一个不可约子代数.显然 \(\mathcal A \neq \{ 0 \}\),原因在 Lemma 1 中已述.我们的证明分三步进行:

  1. 证明 \(\mathcal A\) 中存在一个秩为 \(1\) 的线性变换 \(T_0\)
  2. 证明所有 \(\mathcal B(V)\) 中秩为 \(1\) 的线性变换都在 \(\mathcal A\) 中.
  3. 证明任何 \(\mathcal B(V)\) 中的线性变换都可被分解为若干个秩不超过 \(1\) 的线性变换的和,从而(利用代数对加法的封闭性)\(\mathcal A = \mathcal B(V)\)

Proof (第一部分). \(\mathcal A \neq \{ 0 \}\),可以取 \(T_0\)\(\mathcal A\) 中的一个秩最小的非零线性变换,\(\operatorname{rank}T_0 \geq 1\).考虑反证,假设 \(\operatorname{rank}T_0 \geq 2\),只要构造出一个非零线性变换 \(S_* \in \mathcal A\) 使得 \(\operatorname{Im}S_* \subsetneq \operatorname{Im}T_0\),就能推出矛盾.

\(\operatorname{rank}T_0 \geq 2\),可设 \(\operatorname{Im}T_0\) 中存在两个线性无关的非零向量 \(\{ T_0 x_1,T_0 x_2 \}\)(因此 \(x_1\)\(x_2\) 也线性无关).由 Lemma 1,存在线性变换 \(A_0 \in \mathcal A\) 使得 \(A_0 T_0 x_1 = x_2\),于是 \(\{ T_0 x_1,T_0 x_2 \} = \{ T_0 x_1, T_0 A T_0 x_1 \}\) 线性无关.这意味着 \((\lambda T_0 - T_0 A_0 T_0)x_1 \neq 0\) 对任意 \(\lambda \in \mathbb C\) 成立,即线性变换 \(S_\lambda := \lambda T_0 - T_0 A_0 T_0 \in \mathcal A\) 非零.下面尝试从这些 \(S_\lambda\) 中找到我们想要的 \(S_*\)

  • 注意到 \(S_\lambda = T_0(\lambda I - A_0 T_0)\),故 \(\operatorname{Im}S_\lambda \subset \operatorname{Im}T_0\)
  • 注意到 \(S_\lambda = (\lambda I - T_0 A_0) T_0\),而 \(\operatorname{Im}T_0\)\(T_0 A_0\) 的一个不变子空间.故可以取 \(T_0 A_0\)\(\operatorname{Im}T_0\) 上的限制 \(T_0 A_0 |_{\operatorname{Im}T_0}\).设 \(T_0 A_0 |_{\operatorname{Im}T_0}\) 有一特征值 \(\lambda_0\)(由于 \(\operatorname{Im}T_0\) 是复数域上有限维线性空间),这样 \(\lambda_0 I - T_0 A_0 |_{\operatorname{Im}T_0}\) 就不是单射,因此也不是满射(由于 \(\operatorname{Im}T_0\) 是有限维线性空间),即 \(S_{\lambda_0} = (\lambda_0 I - T_0 A_0) T_0\) 不能映满 \(\operatorname{Im}T_0\)

综上 \(\operatorname{Im}S_{\lambda_0} \subsetneq \operatorname{Im}T_0\)\(0 \neq S_{\lambda_0} \in \mathcal A\),故 \(S_{\lambda_0}\) 就是我们想要的 \(S_*\)

Proof (第二部分). 对任意给定的某一秩为 \(1\) 的线性变换 \(T \in \mathcal B(V)\),任取非零的 \(y \in \operatorname{Im}T\),存在线性函数 \(\varphi \in V^*\) 使得 \(T x = \varphi(x) y,\, \forall x \in V\).已经知道 \(\mathcal A\) 中存在一个秩为 \(1\) 的线性变换 \(T_0\),则任取非零的 \(y_0 \in \operatorname{Im}T_0\),存在线性函数 \(\varphi_0 \in V^*\) 使得 \(T_0 x = \varphi_0(x) y_0,\, \forall x \in V\)

  • Lemma 1,存在 \(A \in \mathcal A\) 使得 \(A y_0 = y\)
  • Corollary 1,存在 \(B \in \mathcal A\) 使得 \(\varphi_0 B = \varphi\)

综上, \[ T x = \varphi(x) y = \varphi_0(Bx) A y_0 = A(\varphi_0(Bx) y_0) = A T_0 B x,\quad \forall x \in V \]\(T = A T_0 B \in \mathcal A\)

Proof (第三部分). \(A \in \mathcal B(V)\) 是任一给定的线性变换,任取 \(V\) 中的一组基 \(b_1,\dots,b_n\),设其对偶基为 \(\varphi_1,\dots,\varphi_n\).定义关于基 \(b_1,\dots,b_n\)\(n\) 个投影变换 \(P_k: x \mapsto \varphi_k(x) b_k\),由对偶基性质,显然有 \(I = \sum_{k=1}^n P_k\),于是 \[ A = A I = A \sum_{k=1}^n P_k = \sum_{k=1}^n A P_k \] 其中每一个 \(A P_k\) 都是秩不超过 \(1\) 的线性变换.

至此,Theorem 1 得到完整证明.

Burnside 定理可以为下面的定理提供一个较为简单的证明.

Theorem 2 \(\mathcal B(V)\) 是单代数,即 \(\{ 0 \}\)\(\mathcal B(V)\) 是代数 \(\mathcal B(V)\) 上唯二的双边理想.

Proof. 显然 \(\{ 0 \}\)\(\{ \mathcal B(V) \}\) 都是双边理想.下面任取一 \(\mathcal B(V)\) 上的双边理想 \(\mathcal I \neq \{ 0 \}\),我们证明它不可约.任取 \(\mathcal I\) 的一个非零不变子空间 \(M\),由 \(M,\, \mathcal I\) 的非零性和 \(\mathcal I V\) 的非零性, \[ M \supset \mathcal I M \supset \mathcal B(V) \mathcal I \mathcal B(V) M = \mathcal B(V) \mathcal I V = \mathcal B(V) (\mathcal I V) = V \] 故只能有 \(M = V\),因此 \(\mathcal I\) 确不可约.现在 \(\mathcal I\)\(\mathcal B(V)\) 的不可约理想,理想一定是子代数,根据 Theorem 1 就有 \(\mathcal I = \mathcal B(V)\)

下面的定理为 \(\mathcal B(V)\) 上的全体代数自同构提供了表示方法.

Theorem 3 \(\mathcal B(V)\) 上的全体代数自同构均为内自同构.即,任意 \(\mathcal B(V)\) 上的自同构 \(\varphi: \mathcal B(V) \to \mathcal B(V)\) 都可写为 \(A \mapsto S A S^{-1}\) 的形式,其中 \(S \in \mathcal B(V)\) 为与 \(\varphi\) 相关的某一可逆线性变换.

将矩阵表示和线性空间的语言相结合,可以为该定理提供思路更清晰的证明.

Proof. 取定 \(V\) 上的一组基 \(x_1,\dots,x_n\),定义 \[ E_{i,j}(x_1,\dots,x_n) := (x_1,\dots,x_n) \hat E_{i,j} \pod{i=1,2,\dots,n;\; j=1,2,\dots,n} \] 其中全体 \(\hat E_{i,j} \in \mathrm M_n(\mathbb C)\) 代表 \(n\) 阶矩阵空间的一组自然基.于是全体 \(E_{i,j}\) 自然也是 \(\mathcal B(V)\) 的一组基.现在只需研究自同构 \(\varphi\)\(E_{i,j}\) 映至何处.为显式地将 \(S\) 确定出来,不妨先考虑 \(\varphi(E_{i,i})\) 的性质.

首先指出,\(\varphi(E_{i,i})\) 仍然是秩为 \(1\) 的投影变换,因为:

  • \(E_{i,i}\) 是投影变换,根据其幂等性和代数自同构保持乘法,\(\varphi(E_{i,i})\) 也是投影变换.

  • \(E_{i,i} \mathcal B(V) E_{i,i}\)\(\mathcal B(V)\)\(1\) 维子空间(从矩阵表示角度考虑),因此 \(\varphi(E_{i,i} \mathcal B(V) E_{i,i}) = \varphi(E_{i,i}) \mathcal B(V) \varphi(E_{i,i})\) 也是 \(\mathcal B(V)\)\(1\) 维子空间.考虑到 \(\varphi(E_{i,i})\) 还是投影变换,故其秩只能为 \(1\)(同样从矩阵表示角度考虑).

现在设 \(\operatorname{Im}\varphi(E_{i,i}) = \operatorname{span}\{y_i\}\).因为 \[ \begin{aligned} \sum_{i=1}^n \operatorname{span}\{y_i\} &= \sum_{i=1}^n \varphi(E_{i,i}) V \\ &\supset \left( \sum_{i=1}^n \varphi(E_{i,i}) \right) V \\ &= \varphi \left(\sum_{i=1}^n E_{i,i} \right) V \\ &= \varphi(I) V = I V = V \end{aligned} \]\(y_1,\dots,y_n\) 仍是 \(V\) 的一组基.定义可逆线性变换 \(S(x_1,\dots,x_n) := (y_1,\dots,y_n)\).至此,断言 \(\varphi\) 就是 \(A \mapsto S A S^{-1}\),为此下面证明 \(\varphi(E_{i,j}) = S E_{i,j} S^{-1}\)

仍然先看 \(\varphi(E_{i,i})\).已经知道 \(\varphi(E_{i,i})\) 是秩为 \(1\) 的投影变换,故 \[ \begin{aligned} &\phantom{\implies .} \varphi(E_{i,i}) y_i = y_i \\ &\implies \varphi(E_{i,i}) S x_i = S x_i \\ &\implies S^{-1} \varphi(E_{i,i}) S x_i = x_i \end{aligned} \] 容易验证 \(S^{-1} \varphi(E_{i,i}) S\) 幂等且秩为 \(1\),因此只能有 \(S^{-1} \varphi(E_{i,i}) S = E_{i,i}\),即 \(\varphi(E_{i,i}) = S E_{i,i} S^{-1}\)

现在看 \(\varphi(E_{i,j})\),为此考察 \(S^{-1} \varphi(E_{i,j}) S\)\(x_1, \dots, x_n\) 映至何处.事实上 \[ \begin{aligned} &\phantom{\implies .} \varphi(E_{i,j}) \varphi(E_{j,j}) = \varphi(E_{i,j} E_{j,j}) = \varphi(E_{i,j}) \\ &\implies \varphi(E_{i,j}) S E_{j,j} S^{-1} = S E_{i,j} S^{-1}\\ &\implies S^{-1} \varphi(E_{i,j}) S E_{j,j} = E_{i,j}\\ &\implies S^{-1} \varphi(E_{i,j}) S x_j = x_i \end{aligned} \] 且对任何 \(k \neq j\)\[ \begin{aligned} (S^{-1} \varphi(E_{i,j}) S) x_k &= S^{-1} \varphi(E_{i,j}) y_k \\ &= S^{-1} \varphi(E_{i,j} E_{j,j}) y_k \\ &= S^{-1} \varphi(E_{i,j}) (\varphi(E_{j,j}) y_k) \\ &= 0 \end{aligned} \] 故可以断定 \(S^{-1} \varphi(E_{i,j}) S = E_{i,j}\),即 \(\varphi(E_{i,j}) = S^{-1} E_{i,j} S\)

Remark. 研究 \(\mathcal B(V)\) 上的自同态时,可能在应用线性变换关于其作用域 \(V\) 的性质时遇到困难.这时需要将其合理转化为 \(\mathcal B(V)\) 上的代数性质,如考虑投影变换的幂等性,将投影变换秩为 \(1\) 转化为 \(\mathcal B(V)\) 上的 \(1\) 维子空间等.这些技巧在证明中多次使用.

References

[1]
H. Radjavi and P. Rosenthal, Simultaneous Triangularization. in Universitext. New York, NY: Springer, 2000. doi: 10.1007/978-1-4612-1200-3.
[2]
S. Axler, Linear Algebra Done Right. in Undergraduate Texts in Mathematics. Cham: Springer International Publishing, 2015. doi: 10.1007/978-3-319-11080-6.